NLP Data Scientist

28 марта 2024 • г Москва • ПАО "Сбербанк" • IT: Data Science и Data Engineering

Ищем специалиста по NLP в DS команду Блока Финансы. Основная задача: разработка и внедрение инструментов по обработке неструктурированных документов.

Категории NLP задач: Классификация, NER, Summarization, Text Retrieval, Question answering.

Пример задачи:

Поддержка и развитие AI сервиса, автоматизирующий работу бухгалтера за счет:

1.     Выделения сущностей из первичных документов (Акт, счет, УПД, Торг-12, СЧФ) (NER)

2.     Проверки наличия печатей и подписей контрагентов (CV)

3.     Классификации типов первичных документов (NLP Classification)

4.     Выделения информации из ЭДО-печатей (NLP)

Обязанности

·       Тестирование LLM архитектур и выбор целевых решений под конкретную задачу совместно с продуктовыми командами

·       Сбор данных и обучение моделей

·       Участие в DevOps процессе в части тестирования и отладки

·       Участие в проведении экспериментов и оценке их результатов

Требования

·       Опыт решения учебных NLP задач

·       Уверенное использование Python, GIT/Bitbucket

·       Умение писать чистый код

·       Хорошее знание математического аппарата

·       Коммуникабельность, умение работать в команде

·       Экспертиза в SoTA LLM архитектурах будет являться преимуществом

Преимущества:

·       Работа в дружной команде с накопленной экспертизой в решении NLP задач

·       Функция DevOps делегирована целевым командам

·      Возможность обмена опытом с разработчиками передовых решений в РФ (RuGPT3, GigaChat, Kandinsky)

·      Внутреннее обучение и участие в DS митапах

·      Оформление по ТК РФ

·      ДМС