Middle Data Scientist (Центр корпоративных решений)
30 июля 2024 • г Москва • ПАО Сбербанк • IT: Data Science и Data Engineering
Наша команда корпоративно-инвестиционного бизнеса (КИБ) Сбера активно развивает направление создания и использования больших языковых моделей (LLM GigaChat). Необходимо будет заниматься разработкой LLM модели, которая взаимодействует с юридическими лицами через сеть контакт-центров по всей России.
Обязанности
- Проверка бизнес-гипотез с использованием LLM на большом количестве данных на кластере с GPU;
- Развитие пайплайна обработки данных и обучения LLM для проведения A/B тестов в продуктах;
- Организация процесса мониторинга качества LLM;
- Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей;
- Участие в формировании требований и необходимых данных по улучшению моделей.
Требования
- Умение решать на практике NLP задачи с использованием LLM (pytorch, transformers);
- Способность оценивать качество полученного результата генеративных LLM;
- Опыт работы с облачными решениями для запуска ИИ сервисов на GPU;
- Английский язык на уровне чтения технической документации, профильных ресурсов, форумов.
Будет плюсом:
- Опыт работы с фреймворками исполнения LLM (DeepSpeed, ONNX);
- Опыт использования векторных баз данных;
- Опыт работы с Apache Spark/PySpark.
Условия
- Формат работы - офис (ст.м.Кутузовская);
- Ежегодный пересмотр зарплаты и годовая премия;
- Корпоративный спортзал и зоны отдыха;
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития;
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа;
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров;
- Вознаграждение за рекомендацию друзей в команду Сбера.