Data Scientist middle+

25 января 2024 • г Москва • ПАО "Сбербанк" • Другое

Вам предстоит участвовать в развитии система форд-мониторинга Сбербанка, которая обеспечивает защиту клиентов банка во всех каналах обслуживания от мобильных приложений и покупок в интернет до визитов клиентов в офисы.

Эта система признана одной из лучших в мире:



  • 17th Annual 2021 Cyber Security Global Excellence Awards winners.

Fraud Prevention GOLD WINNER - SberBank Anti-Fraud System (https://globeeawards.com/cyber-security-global-excellence-awards/winners/)



Наша команда принимает активное участие в развитии этой системы и сосредоточена на разработке и внедрении AI-моделей по выявлению мошенничества.

Вам предоставляется уникальная возможность поработать с действительно большими объемами данных, широким перечнем передовых технологий и сделать значимый вклад в борьбу с мошенничеством в стране.

Вы будете участвовать в развитии система форд-мониторинга Сбербанка, которая обеспечивает защиту клиентов банка во всех каналах обслуживания от мобильных приложений и покупок в интернет до визитов клиентов в офисы.

Обязанности
  • Разработка и развитие моделей и алгоритмов противодействия мошенничеству: скоринг транзакций для выявления фрода/«отмывания» средств, оценка риска сущностей (клиенты, устройства и пр.), анализ и выявление связей, транзакционных аномалий и пр.
  • Мониторинг и регулярный контроль качества работающих в пром. моделей;
  • Анализ доступных источников данных и информации в них, оценка качества для решения задач;
  • Обсуждение задач и методов их решения совместно с фрод-аналитиками и бизнес-заказчиками, формулирование гипотез и их проверка;
  • Построение воспроизводимых и переиспользуемых решений для работы с данными и моделями
  • Взаимодействие с командами инженеров и участие в интеграции решений в промышленную эксплуатацию;
Требования
  • Хорошие знания Python 3
  • Опыт работа с Pandas, SQL, Spark/PySpark, Hive и др. инструментами для анализа малых и больших данных;
  • Опыт использования ML библиотек и алгоритмов на Python (xgboost/lightgbm/catboost, sklearn, …), понимание особенностей и границ применимости;
  • Знание мат. статистики и теории вероятностей, линейной алгебры, математического анализа;
  • Опыт внедрения ML решений в бизнес процессы и доведение их до прома, последующий мониторинг
  • Хорошее понимание методов машинного обучения с точки зрения математики и умение адаптировать их под конкретные задачи
  • Опыт работы с Git
  • Опыт работы с Linux
  • Знание английского языка (чтение документации и статей)


Будет плюсом:



  • Знание Scala
  • Знание одного из фреймворков DeepLearning (Keras/Tensorflow/PyTorch)
  • Опыт автоматизации пайплайнов работы с данными (Airflow и др.), а также ML-пайплайнов (DVC и др.)
  • Опыт работы с AutoML
Условия
  • Молодая и активная команда, состоящая преимущественно из DS и DE.
  • Наличие мощного кластера и сред разработки, включая GPU
  • Возможность поработать с действительно большими объемами данных и сделать значимый вклад в борьбу с мошенничеством в стране