AI команда блока «Развития клиентского опыта» Сбера (CX B2C) ищет Senior Data Scientist для разработки NLP-моделей, дообучения LLM и участия в инициативах по обучению ML-моделей на данных клиентов. В рамках задач предстоит развивать AI-помощников, прогнозировать поведение клиентов, улучшать инструменты анализа обратной связи. В команде работает более 20 человек (DS, MLE, MLOps), имеются большие вычислительные кластеры, лаборатории для обучения моделей на GPU, а также имеется коммуникация с разработчиками LLM-моделей в Сбере.
- Дообучение LLM (GigaChat) под новые предметные области (с учетом клиентских данных) (SFT/LORA)
- Разработка и обучение NLP-моделей для задач умного поиска, суммаризации и классификации текстов
- Формирование гипотез, извлечение инсайтов из текстов, транзакций и других клиентских данных
- Защита моделей перед заказчиком, валидация и мониторинг метрик
- Проведения ревью внутри команды
- Глубокое понимание NLP (от TF-IDF до LLM)
- Опыт в DL: обучение/дообучение собственных глубоких нейросетей (желательно на pytorch)
- Опыт оценки качества результатов (DS и бизнес-валидация)
- Продвинутые знания статистики и машинного обучения
- Опыт программирования на python3 (микросервисы, REST API, база ООП, тесты)
- Опыт работы с GreenPlum / PostgreSQL, Spark
- Владение git, SQL на уровне пользователя
- Опыт разработки классических ML-решений
Будет плюсом:
- Опыт обучения LLM-моделей
- Опыт работы с B2C продуктами / банковский опыт
- Опыт проведения A/B-тестов
- Знания Linux и DevOps на уровне пользователя
- Опыт ведения DS-проектов
- Базовое понимание производственного процесса ИТ-продукта (от идеи до вывода в ПРОМ)