Data Engineer / ML Data Engineer для VLM-моделей

03 июля 2026 • г Москва • ПАО Сбербанк • Информационные технологии:Дата-сайентист

Мы в Центре Робототехники Сбера создаем универсальный воплощенный ИИ для роботов, который будет управлять разнообразными физическими воплощениями: манипуляторами, мобильными колесными роботами, роботами-собаками, мобильными манипуляторами и другими робототехническими платформами.

Сейчас мы ищем в команду специалиста уровня middle/senior.


Первый этап отбора на эту вакансию — общение с AI-рекрутером. После отклика ждите сообщение от него в Сберчате, диалог зайдёт примерно 10 минут. Задача AI-рекрутера — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. AI-рекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным для всех!

Обязанности
  • подготовка и развитие датасетов для обучения VLM-моделей навыкам планирования и взаимодействия с роботом.Сбор, очистка, структурирование и валидация данных экспериментов, результатов работы моделей
  • формирование новых обучающих выборок на основе анализа ошибок моделей и потребностей расширения функционала системы
  • разработка пайплайнов для автоматизации сбора, фильтрации, разметки, проверки качества и версионирования данных
  • курирование разметки данных: подготовка инструкций, контроль качества
  • взаимодействие с ML-исследователями и инженерами для подготовки данных под обучение, дообучение и оценку моделей
  • обучение моделей.
Требования
  • опыт работы с подготовкой и обработкой данных для ML-задач
  • уверенное владение Python и библиотеками для работы с данными (Pandas, NumPy и аналогами)
  • опыт автоматизации процессов подготовки данных и разработки пайплайнов обработки данных
  • понимание принципов контроля качества датасетов и воспроизводимости экспериментов
  • опыт работы с Docker, Linux, Git
  • понимание машинного обучения и подготовки данных для обучения моделей
  • навыки работы с генеративными AI-моделями, опыт создания AI-агентов и использование их в работе будет преимуществом
  • опыт использования GigaChat, Kandinsky и аналогов в продуктах
  • инструментальное владение Ai для анализа, генерации и автоматизации
  • готовность разбираться в предметной области робототехники, VLM-моделей и мультимодальных данных.


Будет плюсом

  • опыт подготовки данных для ML, NLP, CV или мультимодальных моделей
  • опыт работы с данными для обучения LLM/VLM-моделей
  • опыт работы с DVC, MLflow, ClearML или другими инструментами для управления экспериментами и датасетами.
Условия
  • офисный/гибридный формат, адрес Автозаводская 23а к2
  • ежегодный пересмотр зарплаты и годовая премия
  • расширенный ДМС и льготное страхование для семьи
  • уникальная система обучения Сбера для профессионального и карьерного развития
  • выгодная ипотека для сотрудников
  • подписка Прайм с возможностью совместного использования на трёх близких
  • вознаграждение за рекомендацию друзей в команду Сбера.