Middle Data Scientist NLP

14 марта 2024 • г Москва • ПАО "Сбербанк" • IT: Data Science и Data Engineering

Кластер аналитики расширяет команду для лучшего учёта жизненных ситуаций в обслуживании розничных клиентов в контактном центре банка

Мы ищем Data Scientist в команду, комбинирующую применение бизнес-логики, классических моделей, NLP и LLM.

Обязанности
  • Поиск данных, обработка данных, кластеризация, создание эмбеддингов, интеграция в текущие процессы
  • Проведение исследований, проверка гипотез команды с использованием LLM
  • Генерация гипотез на основе данных истории взаимодействия пользователей с использованием prompt-инжиниринга
  • Разработка новых подходов и процессов разметки данных для оценки качества работы LLM
  • Разработка и внедрение моделей (NLP\Классический ML) в промышленные системы
Требования
  • Высшее математическое/техническое образование
  • Понимание принципов работы LLM
  • Проведение A/B тестов
  • Уверенное владение SQL с использованием подзапросов, оконных функций, регулярных выражений
  • Опыт разработки на python + numpy, sklearn, pandas + библиотеки обработки текстовых данных
  • Понимание и опыт практического применения алгоритмов машинного обучения: нейронные сети, композиционные алгоритмы (случайный лес, градиентный бустинг и т.д.) NLP (BERT, TF-IDF)
  • Опыт в части обработки и моделирования данных - не менее 2 лет

Будет плюсом

  • Знание и понимание банковских процессов, опыт в розничной аналитике
  • Опыт работы с Hadoop (HDFS, Hive), Spark
  • Опыт вывода моделей в Пром, регулярного мониторинга качества скорринга
  • Опыт командной разработки (GIT)
Условия

• Корпоративное обучение за счет компании (внутреннее и внешнее)

• Мощное железо, дополнительные мониторы, ноутбук

• Комфортный офис со спортзалом, в наличии кофе/чай и печенье

• Конкурентные условия труда (белая заработная плата, премии)

• Расширенный ДМС с первого дня работы для себя и близких

• Льготная ипотека и банковские продукты на специальных условиях