Наша команда занимается разработкой и применением языковых моделей для улучшения опыта клиентов и сотрудников. Одно из основных направлений работы — повышение технологичности документооборота в Сбере. Наши разработки: мультиязычные NMT-модели для перевода внутренних документов, NER-модели для проверки подлинности договоров, модели на основе Knowledge Graph, модели контролируемой генерации на базе LLM.
Мы активно занимаемся адаптацией GigaChat для QA, суммаризации, генерации текстов, моделирования диалоговых систем. Развиваем собственные решения для применения RL в области NLP. У команды в распоряжении более 40 GPU A100.
Основной стек: PyTorch, Transformers, Accelerate, DeepSpeed
Стек LLM: LangChain, PEFT
Стек NMT: RL4LMS, Jax
Архитектуры: MT5, GigaChat, GPT-neo