MLE (ML-инженер)

15 марта 2024 • г Москва • ПАО "Сбербанк" • IT: Data Science и Data Engineering

 Сбербанк продолжает развитие платформы больших данных. Мы ищем как молодых выпускников, так и опытных специалистов, интересующихся наукой о данных. Преимущество отдаем кандидатам, окончившим лучшие технические и экономические вузы. – ВШЭ, АНХ, МГТУ им Баумана, МГУ, ФизТех, НГУ, и пр. Предпочтения отдаём кандидатам, в специализации которых присутствуют слова "компьютерные науки".

Команда Sber Ai Lab совместно с командой «Гео и графы» кластера «AI360» корпоративного блока Сбербанка ведет проект по созданию мультимодальной модели эмбеддингов.

Команда «Гео и графы» развивает несколько направлений: витрины данных о связанности ЮЛ, клиентские данные ЮЛ, транзакционные витрины данных, графы связей ЮЛ, геовитрины по данным ЮЛ. Все витрины используются для построения моделей в различных бизнес-блоках Банка.

Sber Ai Lab занимается как научной деятельностью, так и разработкой наукоемких технологий в области финансов, экономики, рекомендательных систем и т.д. В частности, в лаборатории активно разрабатываются фреймворки для машинного обучения, значительная часть которых доступна в open source. На текущий момент в Лаборатории существуют направления: инструментов машинного обучения, AI в медицине, прикладного машинного обучения, технологий глубинного обучения, на которые мы ищем специалистов Data Engineers уровня Middle и Senior. Наша команда состоит из специалистов с опытом в известных IT-компаниях, мастеров Kaggle, ученых с публикацими на ведущих конференциях NIPS, ICML, KDD, RecSys

Обязанности
  • Разработка и проектирование потоков данных, алгоритмов загрузки и обработки данных
  • Подготовка датасетов из больших массивов сырых данных, первичный анализ данных
  • Выявление артефактов в данных
  • Инженерная часть разработки наукоемких технологий в части инжиниринга данных
  • Взаимодействие с прикладными командами банка по внедрению технологий, разработанных лабораторией, а также мультимодальных моделей в процессы банка
  • Организация инфраструктуры хранения данных для исследований
  • Участие в сложных интеграционных проектах по развитию гибридного DWH Сбербанка (Hadoop, GreenPlum)
  • Участие во внедрении моделей на основе алгоритмов machine learning
Требования
  • Высшее техническое образование
  • Наличие практического опыта работы с Apache Spark обязательно
  • Хорошее знание Python (в том числе опыт работы с фреймворками Python по подготовке данных (Pandas, NumPy, SciPy, PySpark)
  • Опыт разработки от 1 года
  • Высокая техническая грамотность (алгоритмический базис)
  • Понимание слов machine learning и deep learning
  • Знание SQL
  • Умение анализировать научную литературу, разбираться в незнакомой теме
  • Желание заниматься инженерной и инфраструктурной стороной проблемы
  • Scripting (bash/powershell) обязателен, поднимать и настраивать сервера в облачных средах часто приходится самостоятельно
  • Опыт разработки под Linux среды (Ubuntu, RedHat)
  • Знание систем контроля версий, опыт коллективной разработки. У нас Git (BitBucket внутри сети банка и GitHub/GitLab в остальных случаях)
  • Фундаментальные знания принципов построения распределенных систем хранения и обработки данных
  • Навыки программирования на Scala/Java или C++
  • Опыт работы с реляционными СУБД (Oracle, MS/SQL), навыки оптимизации запросов
  • Опыт работы с МРР GreenPlum
  • Опыт работы с системами версионирования данных типа DVC
  • Опыт работы с ETL-инструментами
  • Знания предметной области «Банки и финансы»
Условия
  • Гибрид (значительная часть работы связана с подготовкой ПО для инфраструктуры банка)
  • Высококвалифицированный коллектив
  • Конкурентный уровень заработной платы, а также годовые премии по результатам работы
  • Участие в создании и развитии OpenSource продуктов,а также возможность совмещать работу с соревнованиями Kaggle и написанием научных статей
  • ДМС, страхование от несчастных случаев, социальные гарантии, корпоративные мероприятия
  • Сниженные ставки по кредитованию, программы лояльности для сотрудников
  • Возможность профильного обучения (обучение, сертификация, конференции)
  • Интересные, сложные, амбициозные задачи
  • Локация: метро Кутузовская