MLOps - инженер

09 июля 2024 • г Москва • ПАО Сбербанк • IT: Поддержка, DevOps и администрирование

Мы команда робототехники Центра Робототехники Сбера. Прямо сейчас мы стоим на пороге нового и увлекательного проекта, который объединяет в себе мобильную и манипуляционную робототехнику.

Наша цель достаточно амбициозна - создать универсальный мозг для робота, программный стек, который сможет работать с различными подвижными платформами и манипуляторами. При этом робот будет воспринимать команды от человека, сформулированные на естественном языке.

Мы ищем единомышленников, которые разделяют нашу страсть к робототехнике и обладают навыками разработки северного программного обеспечения для различных задач.

Обязанности
  • Создание/Внедрение MLOps-практик (стенды, процессы, DevOps) для исследований в направлениях RL, LLM/VLM: среды разработки, тестирования, инференса и мониторинга моделей в различных режимах работы (Batch, Streaming) и использования ресурсов (CPU, GPU)
  • Настройка инструментов отслеживания жизненного цикла моделей (ClearML, MLFlow, DVC и т.п.)
  • Развитие LLMOps-практик (эффективный инференс LLM для ChatGPT-like решений)
  • Помощь команде Исследователям в выводе моделей в прод
Требования
  • Опыт работы в качестве DevOps/MLOps/MLE
  • Знать Язык программирования Python, Go, Bash
  • Опыт выстраивания CI/CD, DAG-пайплайнов для разработки-тестирования-инференса моделей
  • Знание принципов организации распределённых информационных систем и баз данных


Будет плюсом:


  • Опыт развёртывания и использования MLOps-инструментов (MLflow, ClearML, DVC и т.п.)
  • Опыт работы с k8s, умение разрабатывать и поддерживать сервисы в этой среде
  • Опыт работы с KuberFlow, умение разрабатывать и поддерживать модели в этой среде
  • Опыт работы с Feature Store и обеспечения ежедневной работы потоков данных
  • Теоретические и практические знания векторных баз данных (Qdrant, Milvus и т.п.)
  • Опыт разработки REST-сервисов
  • Опыт разработки gRPC-сервисов
  • Опыт работы с KServe
  • Опыт работы с Nvidia Triton
  • Опыт работы с TensorRT/TensorRT-LLM
  • Опыт отладки Spark-джоб, умение разбираться в ML-алгоритмах (бустинги, сетки, LLM, распределённые вычисления)
Условия
  • Дружный и высококвалифицированный коллектив;
  • Уникальные масштабные проекты, работа в приоритетном направлении;
  • Достойная заработная плата (оклад + годовая премия);
  • Современные рабочие места и программное обеспечение;
  • ДМС, корпоративная пенсионная программа, страхование от несчастных случаев, социальные гарантии, корпоративные мероприятия;
  • Высокий уровень корпоративной культуры;
  • Работа в офисе (г. Москва), возможность гибридного графика