Reinforcement learning engineer

27 мая 2024 • г Москва • ПАО Сбербанк • IT: Разработка

Мы команда робототехники Центра Робототехники Сбера. Прямо сейчас мы стоим на пороге нового и увлекательного проекта, который объединяет в себе мобильную и манипуляционную робототехнику. Наша цель достат_очно_ амбициозна - создать универсальный мозг для робота, программный стек, который сможет работать с различными подвижными платформами и манипуляторами. При этом робот будет воспринимать команды от человека, сформулированные на естественном языке.

Наша миссия заключается в том, чтобы сделать робототехнику более доступной для людей, устранить препятствия, которые могут возникнуть при внедрении робототехнических комплексов в промышленности, сельском хозяйстве и повседневной жизни.

Что из себя представляет команда?

В Центре Робототехники Сбера собрана уникальная команда экспертов, которые обладают глубокими знаниями как в мобильной, так и в манипуляционной робототехнике. В нашей команде собраны лучшие робототехники страны, мы регулярно побеждаем на мировых соревнованиях и публикуем свои научные работы на топовых робототехнических конференциях - IROS и ICRA. Мы обладаем экспертизой, охватывающей различные аспекты робототехники:

  • Computer Vision
  • Reinforcement Learning
  • Trajectory Prediction
  • SLAM
  • Motion & Trajectory Planning
  • Control.
Обязанности
  • реализация и обучение SoTA Reinforcement Learning or/and Imitation Learning алгоритмов и работа с соответствующими фреймворками
  • изучение научных статей в поисках путей улучшения текущих алгоритмов применительно к роботам
  • проектирование архитектуры системы
  • написание документации
  • формирование требований для симуляторов.
Требования

Опыт обучения агентов с помощью (хотя бы одна):

  • einforcement Learning
  • Imitation Learning
  • Behavior Cloning
  • Inverse Reinforcement Learning.
  • опыт работы с: Pytorch, Docker
  • опыт сбора и курирования разметки данных.

Хотя мы ожидаем, что потенциальные кандидаты будут обладать некоторыми из перечисленных качеств, мы также открыты для тех, кто может дополнить нашу команду другими ценными навыками и качествами.

Также будет плюсом:

  • успешный опыт участия в соревнованиях
  • опыт доведения исследований до продакшена
  • опыт работы с симуляторами
  • опыт работы с мобильными роботами и/или манипуляторами
  • опыт работы с: MLOps, CI/CD
  • опыт работы с: JAX
  • Open-source проекты
  • опыт работы с ROS1 / ROS2.
Условия
  • офисный формат, метро Кутузовская
  • стабильный оклад и социальная поддержка сотрудников
  • расширенное ДМС с первого дня работы для сотрудников и льготная медицинская страховка для близких
  • льготные условия кредитования для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров: СберМаркет, Самокат, Еаптека, Мегамаркет
  • корпоративная пенсионная программа
  • корпоративное обучение за счет компании
  • реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 100 тыс. рублей
  • корпоративный спортзал и скидки в спортзалы-партнеры
  • скидки на продукты Сбера и компаний-партнеров.