Стажёр-студент Data Scientist (GenAI / B2B)

70 00080 000
до вычета налогов
02 июля 2026 • г Санкт-Петербург • ПАО Сбербанк • Информационные технологии:Дата-сайентист
можно без опыта

Мы — команда разработки решений на базе машинного обучения и генеративного искусственного интеллекта в Корпоративно-инвестиционном бизнесе (КИБ) Сбера.

Наша цель — создавать продукты, которые помогают крупнейшим компаниям России и малому бизнесу эффективнее управлять финансами, автоматизировать рутину и принимать инвестиционные решения.

Сейчас мы ищем талантливых студентов, готовых погрузиться в разработку реальных AI-решений для сложного B2B-сегмента.

Обязанности
  • проводить анализ корпоративных данных совместно с аналитиками КИБ, участвовать в разметке датасетов и проверять гипотезы о поведении бизнес-клиентов
  • участвовать в процессах кросс-валидации, A/B-тестирования и мониторинга качества ML-моделей в промышленной эксплуатации
  • разрабатывать и поддерживать пайплайны генерации контента и обработки документов на основе больших языковых моделей (LLM): от извлечения сущностей из финансовой отчетности до суммаризации деловых переписок
  • исследовать и тестировать новые алгоритмы и архитектуры нейросетей для задач автоматизации банковских процессов юридических лиц
  • создавать прототипы интеллектуальных систем (например, агентов для поддержки клиентских менеджеров или скоринговых моделей), используя современный MLOps-стек.
Требования
  • обучаетесь на 3–4 курсе бакалавриата или 1–2 курсе магистратуры технического направления
  • уверенно владеете Python, пишете чистый код, понимаете принципы объектно-ориентированного программирования (ООП) и SOLID
  • имеете практический навык проведения разведочного анализа данных (EDA) и визуализации результатов
  • понимаете математические основы классического машинного обучения (регрессия, классификация, кластеризация, метрики качества)
  • владеете инструментами предобработки табличных данных (pandas, numpy)
  • знакомы с экосистемой LLM: имеете опыт работы с фреймворками LangChain/LlamaIndex и библиотекой vLLM для инференса
  • решали учебные или пет-проекты с помощью генеративных моделей (чат-боты, RAG-системы, работа с эмбеддингами).


Будет плюсом:

  • опыт работы с распределенными вычислениями (Apache Spark, PySpark) для обработки больших данных
  • практический опыт создания AI-агентов, использующих внешние инструменты (tool calling) для выполнения действий
  • опыт использования API семейства моделей GigaChat или других российских фундаментальных моделей
  • навык написания SQL-запросов для самостоятельной выгрузки данных из хранилищ
  • базовое знание Docker для контейнеризации своих приложений.
Условия
  • оплачиваемая стажировка сроком 3 месяца с возможностью последующего трудоустройства в штат
  • офисный формат (40 часов в неделю), позволяющий полностью погрузиться в задачи команды, гибкий график
  • работа в офисе IT-хаба Сбера по адресу: Санкт-Петербург, ул. Уральская, д. 1 (10 минут пешком от ст. метро «Василеостровская» или «Спортивная»)
  • реальные задачи под руководством опытных менторов — вы будете работать над продуктами, которыми пользуются тысячи предпринимателей
  • доступ к мощным вычислительным ресурсам (GPU-кластеры) и внутренним дата-сервисам банка
  • программа адаптации, внутреннее обучение по Deep Learning и NLP, а также доступ к корпоративной библиотеке.