Middle Data Scientist (NLP)

10 июня 2024 • г Москва • ПАО "Сбербанк" • IT: Data Science и Data Engineering

Наша команда собирает данные по обработке документооборота сотрудниками бэк-офиса. Варим на них nlp-пайплайны автоматической обработки документов. Также активно занимаемся r&d в направлении использования llm для автоматизации ручных процессов.

Обязанности
  • Адаптировать llm модели для проверки бизнес-гипотез: база знаний, реализация логических проверок, извлечение знаний из документов
  • Решать классические nlp задачи (ner, question answering, text classification, summarization) в применении к документам
  • Иногда решать классические ml задачи, в рамках проверки r&d гипотез, например распределить задачи между сотрудниками с учетом ограничений на систему
Требования
  • Знание dl фреймворков, опыт обучения трансформеров, seq2seq, сверточных сетей
  • Желание работать с production данными (иногда нужно причесывать самостоятельно, даже если есть разметчики)
  • Любознательность в части современных технологий (у нас есть reading club на котором разбираем статьи)
  • Знание современных nlp архитектур и подходов к их обучению
  • Понимание текущего состояния эволюции больших языковых моделей


Будет плюсом:

  • Опыт планирования архитектуры приложений и создания ml-сервисов
  • Желание решать не только nlp, но и классические ml задачи
  • Опыт оптимизации нейросетей в проде
  • Опыт работы в крупном банке
Условия
  • Отсутствие работы в стол и быстрая обратная связь по разработанным моделям (есть качественный мониторинг и ит-команда для внедрения)
  • Белая ЗП и приятные годовые бонусы
  • ДМС
  • Комфортный отдельный кабинет
  • Тренажерный зал и столовая в офисе
  • Поддерживаем саморазвитие. Оплачиваем курсы, книги, конференции