Data Scientist (NLP)

08 мая 2024 • г Москва • ПАО "Сбербанк" • IT: Data Science и Data Engineering

Ищем к себе в команду (сервис «Новостной мониторинг») Data Scientist.

Задача сервиса - сбор и обработка информации из новостных источников для мониторинга состояния заемщиков банка.

Команда решает end-to-end задачу: занимается как парсингом/скрапингом источников (около 30 тыс штук), так и разработкой моделей для обработки полученной информации в реальном времени. За счет моделей решаются вспомогательные (фильтрация источников, перевод, суммаризация) и бизнес-задачи (поиск в новостях компаний-заемщиков банка и событий, которые с ними произошли).

Для мониторинга состояния некоторых заемщиков более актуальны не текстовые данные, а изображения со спутников, поэтому команда также занимается сбором таких данных и их обработкой с помощью CV моделей.

Обязанности
  • Обучение и вывод моделей в промышленное использование (Triton, tensorRT);
  • Улучшение и ускорение моделей для анализа текстовых данных из новостного потока (NER, entity linking, классификация, дедубликация, перевод, суммаризация новостей);
  • Параллельно начинаем развивать направление анализа спутниковых снимков (классификация/сегментация), поэтому опыт в CV будет плюсом.
Требования
  • Хорошее понимание области NLP (знание классических и SOTA архитектур моделей);
  • Стек: Python/Pytorch/Tensorrt/Docker/PostgreSql/ElasticSearch;
  • Понимание основных принципов и алгоритмов классического ML;
  • Опыт перевода бизнес-задач в термины MLю;
  • Навыки написания продакшн-кода на Python.
Условия
  • Ипотека выгоднее для каждого сотрудника и льготные условия кредитования;
  • Бесплатная подписка СберПрайм+;
  • Скидки на продукты компаний-партнеров;
  • ДМС с первого дня и льготное страхование для близких;
  • Корпоративная пенсионная программа;
  • Обучение за счет Компании: онлайн курсы в Виртуальной школе Сбера и неограниченный доступ к библиотеке, обучение в Корпоративном университете, Тренинги, митапы и возможность получить новую квалификацию;
  • Крупнейшее DS&AI community - более 600 DS банка, включая: регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы.