Data Scientist NLP

18 апреля 2024 • г Москва • ПАО "Сбербанк" • IT: Разработка

Команда продукта «Интеллектуальная система управления руководителя» создает продукт, который включает AI-сервисы для повышения эффективности работы руководителя:


  • голосовой Виртуальный Ассистент на базе «Салют» (навыки работы с текстом, аудио, поиск информации по корпоративной базе знаний)
  • Knowledge Assistant с использованием LLM для поиска и работы с информацией в корпоративной базе знаний
  • сервис Speech2Text + LLM для автоматического протоколирования совещаний
  • LLM для саммаризации протоколов совещаний, почты, заметок и пр.
  • LLM и др. генеративные модели для генерации текстов (писем, заметок), презентаций, документов
  • OCR и LLM для распознавания и работы с документами (саммаризация, комментарии к материалам)
  • взаимодействие ведется с командами внутри Блока, подразделениями Блока Технологии (SberDevices), Департаментом ИИ (AI Lab, Sber AI), Управлением валидации.
Обязанности
  • сбор, анализ и агрегирование научной, технической и продуктовой информации из открытых источников по направлениям: Генеративный ИИ, Мультимодальные LLM, NLP, Speech-to-Text, Text-to-Speech, и др.
  • анализ трендов в области ИИ
  • прототипирование гипотез и AI моделей
  • консультирование/Участие в разработке продуктовых версий моделей
  • участие в разработке AI стратегии развития продукта
  • тесное взаимодействие с бизнес-заказчиком для выявления требований к AI-компоненте продукта
  • консультирование / участие в автоматизации источников данных для ML моделей совместно с ML Engineer/Data Engineer.
Требования
  • образование в техническом ВУЗе в сфере компьютерных наук, прикладной математики или статистики. Наиболее приоритетны: МФТИ, ВШЭ, МГУ, Сколтех, НГУ, МИФИ
  • глубокое понимание ML/DL алгоритмов, NLP и LLM
  • опыт написания научных статей по машинному обучению или близкой сфере: В приоритете NLP, Speech2Text, статистика
  • опыт презентации результатов научных работ на конференциях
  • опыт разработки научных прототипов ML моделей
  • опыт участия в разработке промышленных ML моделей (будет плюсом);
  • умение переводить бизнес-постановку задачи в ML-постановку, грамотная интерпретация полученных результатов
  • высокий уровень владения ядром Python и SQL
  • свободное владение базовыми библиотеками на Python, в том числе: pandas, numpy, matplotlib, seaborn
  • знание фреймворков, библиотек, алгоритмов машинного обучения: Scikit-learn, Pytorch, xgboost, catboost, tensorflow, transformers
  • технический английский статьи, документация)
  • преимущество: pet-projects на Github, владение Confluence, Jira, медали на Kaggle, готовность брать на себя коммуникацию с бизнес-заказчиком, опыт DS-менторства
  • PhD (будет преимуществом).
Условия

·      стабильный оклад и социальная поддержка сотрудников

·      расширенное ДМС с первого дня работы для сотрудников и льготная медицинская страховка для близких

·      льготные условия кредитования для каждого сотрудника

·      бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров: СберМаркет, Самокат, Еаптека, Мегамаркет

·      корпоративная пенсионная программа

·      корпоративное обучение за счет компании

·      реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 100 тыс. рублей

·      корпоративный спортзал и скидки в спортзалы-партнеры

·      скидки на продукты Сбера и компаний-партнеров.