Наша команда занимается R&D и бизнес внедрением метрики CLTV (Client Life-Time Value) по клиентам – физическим лицам Сбербанка. Мы ищем Data Scientist’a для работы с моделями последовательностей событий (Transformer, LSTM, RNN) и c классическим машинным обучением на табличных данных (gradient boosting, RF), который сможет имплементировать SOTA ML-решения в модели прогнозирования CLTV.
Основные зоны ответственности в рамках направления:
· Разработка ML-моделей для базы 100+ млн розничных клиентов Сбербанка
· Создание и тестирование представлений клиентов (embeddings) для использования в моделях ·
· Работа с огромными массивами данных (Spark, Hadoop, GreenPlum) ·
· Разработка подхода по расчету чувствительности прогнозов к изменению входных параметров (эластичность к действиям банка/свойствам клиента) ·
· Взаимодействие с командой внешних R&D исследователей ·
· Поиск, объединение и нормализация данных ·
· Работа с командой DS-разработчиков, менторство, постановка задач на разработку
· Отличные знания в области классического data science / математики / статистики ·
· Опыт работы с BigData (Hadoop, hdfs, pyspark) – преимущество ·
· Опыт A/B тестирования – преимущество ·
· Понимание принципа работы банковского или финансового бизнеса – преимущество ·
· Конкурентную компенсацию
· Гибридный график работы при желании (1-2 дня работа из дома) Огромные массивы данных
· Дружную команду профессионалов (МФТИ, ВШЭ, МГУ, РЭШ, Сколтех)
· Комфортабельный офис недалеко от метро Кутузовская с корпоративным фитнесом
· Оформление по ТК РФ
· ДМС
· Бесплатный спортзал
· Бесплатный кофе/печенки на этаже
· Возможность развития и участия в DS/DA сообществе Сбербанка (более 1000 DS/DA банка)