Senior Data Scientist (NLP)

27 апреля 2024 • г Москва • ПАО "Сбербанк" • IT: Data Science и Data Engineering

Ищем к себе в команду (сервис «Новостной мониторинг») Data Scientist.

Задача сервиса - сбор и обработка информации из новостных источников для мониторинга состояния заемщиков банка.

Команда решает end-to-end задачу: занимается как парсингом/скрапингом источников (около 30 тыс штук), так и разработкой моделей для обработки полученной информации в реальном времени. За счет моделей решаются вспомогательные (фильтрация источников, перевод, суммаризация) и бизнес-задачи (поиск в новостях компаний-заемщиков банка и событий, которые с ними произошли).

Для мониторинга состояния некоторых заемщиков более актуальны не текстовые данные, а изображения со спутников, поэтому команда также занимается сбором таких данных и их обработкой с помощью CV моделей.

Обязанности
  • Обучение и вывод моделей в промышленное использование (Triton, tensorRT);
  • Улучшение и ускорение моделей для анализа текстовых данных из новостного потока (NER, entity linking, классификация, дедубликация, перевод, суммаризация новостей).
Требования
  • Python/Pytorch/Tensorrt/Docker/PostgreSql/ELK;
  • Хорошее понимание области NLP (знание классических и SOTA архитектур моделей);
  • Понимание основных принципов и алгоритмов классического ML;
  • Умение переводить бизнес-задачи в термины ML;
  • Навык написания production-ready кода.
Условия
  • Ипотека выгоднее для каждого сотрудника и льготные условия кредитования;
  • Бесплатная подписка СберПрайм+;
  • Скидки на продукты компаний-партнеров;
  • ДМС с первого дня и льготное страхование для близких;
  • Корпоративная пенсионная программа;
  • Обучение за счет Компании: онлайн курсы в Виртуальной школе Сбера и неограниченный доступ к библиотеке, обучение в Корпоративном университете, Тренинги, митапы и возможность получить новую квалификацию;
  • Крупнейшее DS&AI community - более 600 DS банка, включая: регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы.