Аналитик-разработчик речевых технологий

31 марта 2024 • г Москва • ПАО "Сбербанк" • IT: Data Science и Data Engineering

SberDevices - инновационное направление компании, которое создает умные устройства, виртуальных ассистентов и другие продукты в области LLM, Speech Recognition, Computer Vision.

Основные задачи:

- Персонализация. Мы делаем технологию распознавания владельца умного ассистента по голосу, чтобы делать персональные рекомендации фильмов и музыки для каждого члена семьи, а таже сделать голосовые покупки еще более быстрыми и безопасными.

- ASR - распознавание речи, automatic speech recognition. Краеугольная задача нашего отдела - сделать качественный, быстрый и стабильный ASR.

- Keyword Spotting (Wake-word detection) - важный компонент речевых технологий, через который проходит любое взаимодействие пользователя с устройством. Цель алгоритма keyword spotting - выявить ключевое слово в условиях шума и не допустить ложных активаций.

Обязанности
  • работать бок о бок с нашими DL инженерами и ресечерами
  • предлагаь сценарии экспериментов в части даннх
  • разбираться, где наши слабые и сильные стороны
  • строить дата-пайплайны, инфраструктуру и улучшать разметку
Требования
  • знаешь Python на высоком уровне (алгоритмы, структуры данных, GIL, async)

  • имеешь опыт работы над улучшением качества моделей

  • базовое знание статистики

  • драйв. Дата аналитики могут стать центром ML движухи, мы ищем очень активных людей

  • Будет преимуществом:

  • обучение в ШАД

  • опыт с краудсорсингом

  • опыт работы с моделями распознавания речи

Условия
  • мощные сервера, терабайты данных
  • молодая, дружная и очень сильная команда выпускники топовых вузов
  • свой сервис разметки, прямое влияние на данные и соответственно весь ML
  • конференции и обучение, возможность выступать на внутренних и внешних мероприятиях
  • Гибридный формат работы в Москве (или удаленка по РФ до 3х месяцев в году)