Data Engineer (Рекомендательная система)

19 июня 2024 • г Москва • ПАО "Сбербанк" • IT: Data Science и Data Engineering

Дорогой кандидат, мы - динамично растущая команда экспертов в области построения рекомендательных систем.

Наша главная цель - построить современную, масштабируемую платформу, которая будет постоянно предвосхищать и превосходить ожидания пользователей, предоставляя им персонализированный и релевантный контент на всем клиентском пути в экосистеме Сбер. Наша платформа будет обслуживать широкий круг потребителей и строить персональные рекомендации во всех сферах бизнеса, таких как музыка, фильмы, онлайн торговля, медицина, логистика и многих других, которые присутствуют в быстро растущей экосистеме. Если ты мечтаешь поучаствовать в создании такой рекомендательной системы, то тебе к нам!

Наша платформа будет обслуживать широкий круг потребителей и строить персональные рекомендации во всех сферах бизнеса, таких как музыка (Звук), фильмы (ОККО), онлайн торговля (СберМаркет, СберМегаМаркет), медицина (еАптека) и многих других, которые присутствуют в быстро растущей экосистеме. Если ты мечтаешь поучаствовать в создании такой рекомендательной системы, то тебе к нам!

Интеллектуальное ядро такой системы - это алгоритмы машинного обучения, которые анализируют по-настоящему большие данные, и в реальном времени рассчитывают предпочтения миллионов конечных пользователей. Работая в нашей команде, ты будешь участвовать в исследовании, разработке, тестировании и внедрении самых передовых алгоритмов классического и глубокого обучения в части рекомендаций. Ты получишь опыт внедрения таких алгоритмов в реальной индустриальной экосистеме, начиненной большими данными и работающей с высокими нагрузками при их обработке.

Обязанности

Что предстоит делать:

  • Разработка продакшен-пайплайнов обработки данных;
  • Продуктизация прототипов команды Data Science;
  • Performance оптимизации кода по обработке больших массивов данных или онлайн сервисов рекомендаций с высокой нагрузкой.

Стек технологий:

  • Для разработки используем: Python, PySpark, Pandas, Redis, PostgreSQL, AirFLow, MLFlow и др.
  • Для организации работы: Jira, Confluence, Git.
Требования
  • Мотивация учиться и развиваться в области рекомендательных систем;
  • Экспертное знание Python;
  • Уверенное знание Spark (и желательно Pandas);
  • Опыт написания промышленных пайплайнов обработки данных, содержащих множество шагов, зависимостей и сложную логику;
  • Опыт использования Airflow (или другого industry-standard оркестраторов пайплайнов, т.к. Luigi, Dagster и т.д.);
  • Хорошее понимание баз данных SQL / NoSQL.
Условия
  • Официальное трудоустройство согласно ТК РФ;
  • Белая заработная плата (оклад + годовая премия);
  • Страхование (от несчастных случаев, ДМС);
  • Оздоровительные программы для детей сотрудников;
  • Возможность обучения за счет компании;
  • Выплаты материальной помощи в особых/чрезвычайных случаях;
  • Дисконт-программы от компаний партнеров (фитнес, страхование, туризм);
  • Льготное кредитование;
  • Столовая на территории офиса.