Data Scientist / NLP-инженер (Sberbank International)

21 апреля 2026 • г Москва • ПАО Сбербанк • IT: Data Science и Data Engineering

Мы — команда, создающая ядро интеллектуальных сервисов для международной аналитической платформы. Наш продукт помогает бизнесу принимать стратегические решения на глобальных рынках, используя любые типы данных — от новостных лент до внутренних баз знаний.

Мы ищем сильного и самостоятельного специалиста, который хочет заниматься автономными ИИ‑агентами, а не просто обёртками над LLM. Вы будете влиять на архитектуру, выбирать технологии и отвечать за полный жизненный цикл ML‑продукта в on‑premise‑среде.

Обязанности
  • Разрабатывать production‑ready ИИ‑агентов
  1. Проектировать multi‑agent системы для бизнес‑задач: оценка рисков, анализ контрагентов, поиск альтернативных рынков, санкционный комплаенс.
  2. Реализовывать планирование (planning), использование инструментов (tool use), управление памятью (memory) и рефлексию агентов.
  3. Внедрять систему оценки агентов: метрики точности, надёжности и эффективности выполнения цепочек действий.
  • Создавать и оптимизировать RAG‑пайплайны
  1. Многоканальная индексация (веб‑страницы, PDF, базы данных, устная речь)
  2. Эксперименты с chunking, embedding‑моделями, retrieval‑стратегиями (гибридный поиск, re‑ranking, query rewriting)
  • Строить высоконагруженные ML‑сервисы

Асинхронное выполнение, кеширование, rate limiting, fallback‑механизмы.

  • Весь цикл ML‑продукта

От исследования и прототипирования до CI/CD, мониторинга дрейфа моделей и A/B‑тестов агентных сценариев

  • Интегрировать LLM в микросервисную архитектуру
  1. Как open‑source (Llama, Mistral, Qwen), так и коммерческие модели
  2. Упаковка моделей в Triton, vLLM или llama.cpp для on‑premise
  • Обеспечивать производительность и надёжность

Оптимизация latency / throughput, работа с ограничениями GPU, баланс между качеством и скоростью

  • Работать в связке с бэкендом и продуктом

Бесшовная интеграция агентных сценариев в основную платформу.

Требования
  • Опыт разработки и вывода в production LLM‑приложений, особенно агентов (LangGraph, AutoGen, CrewAI, Semantic Kernel)
  • Глубокое понимание паттернов: ReAct, Reflection, Tool use, RAG, Memory (краткосрочная/долгосрочная)
  • Уверенная работа с Python и ML‑стеком (PyTorch, transformers, langchain/llamaindex, vLLM, sentence‑transformers)
  • Опыт с векторными БД (Milvus, Qdrant, Weaviate) и поисковыми движками (Elasticsearch, OpenSearch)
  • Понимание метрик качества агентов (task success rate, token efficiency, tool accuracy) и методов оценки (LLM‑as‑judge, human‑in‑loop)
  • Опыт работы с Python + FastAPI (или аналоги) – для сервисов агентов и RAG
  • Опыт работы с SQL, опыт с PostgreSQL (включая pgvector)
  • Опыт работы с Docker, Kubernetes (helm, kustomize)
  • Опыт работы с CI/CD (GitLab CI, GitHub Actions) – автоматическое тестирование агентных пайплайнов
  • Опыт работы с мониторингом: Prometheus, Grafana, Loki, а также observability LLM‑приложений (LangSmith, Arize Phoenix)

Будет плюсом:


  • Опыт с fine‑tuning LLM (LoRA, QLoRA, DPO) для улучшения следования инструкциям и формату вызова инструментов
  • Опыт работы с классическим ML
  • Навыки оптимизации моделей (quantization, pruning, distillation) для on‑premise
Условия
  • офисный или гибридный формат в Москве
  • ежегодный пересмотр зарплаты и годовая премия
  • расширенный ДМС и льготное страхование для семьи
  • уникальная система обучения Сбера для профессионального и карьерного развития
  • выгодная ипотека для сотрудников
  • бесплатная подписка СберПрайм+, скидки на продукты компании-партнёров
  • вознаграждение за рекомендацию друзей в команду Сбера
  • корпоративная пенсионная программа.