Middle/Senior Data Scientist NLP GigaChat

15 ноября 2023 • г Москва • ПАО Сбербанк • IT: Data Science и Data Engineering

Предстоит заниматься созданием и имплементацией в бизнес процессы SOTA подходов и алгоритмов, в том числе больших foundation моделей (BERT-like, GPT-like), аккумулирующих в себе большой объем данных о продуктах и клиентах, способных решать разные прикладные задачи бизнеса (recsys, campaign и др). Работа команды в стиле RnD for business: проводим эксперименты, выбираем наилучшее решение, доводим до бизнеса.

Обязанности
  1. Поиск новых AI подходов и применение существующих для решения бизнес-задач общение с бизнесом, исследование рынка технологий машинного обучения
  2. ML-research: Проводим эксперименты, реализуем подход\модель - замеряем эффект
  3. Обучение текстовых классификаторов, кластеризация, openQA, closeQA, суммаризация, NER  
  4. ML-dev, Разработка готового решения: от обученной модели до конечного сервиса, выкатка модели на пром.
  5. Предоставляем бизнесу готовый сервис. 
  6. Совместно с бизнесом проводим пилот на новой технологии, собираем данные, размечаем, оцениваем.
Требования

Техстек:

  1. jenkins, git, dvc, clearml, MLflow, bash, linux, flask, API, pytorch, python, docker.
  2. Transformers, опыт тренировки GPT-like, BERT-like моделей, 
  3. Опыт работы с данными, отбор, анализ, парсинг, обработка.
  4. Желание выдвигать гипотезы как улучшить процессы, общаться с бизнесом

Будет плюсом:

  1. Знания в области создания чат ботов. 
  2. Умение работать с большими данными
Условия
  1. Корпоративное обучение за счет компании (внутреннее и внешнее)
  2. Мощное железо, дополнительные мониторы, ноутбук
  3. Комфортный офис со спортзалом, в наличии кофе/чай и печенье
  4. Конкурентные условия труда (белая заработная плата, премии)
  5. Расширенный ДМС с первого дня работы для себя и близких
  6. Льготная ипотека и банковские продукты на специальных условиях