Data Scientist (ViewPoint)

31 января 2024 • г Москва • ПАО "Сбербанк" • IT: Разработка

Формируется новая команда для исследований эффективности работы IT в группе компаний Сбер. Мы проводим сбор и анализ различных данных, описывающих поведение и результаты работ более 2000 команд. В том числе готовим данные и обучаем модели LLM. Основное направление работ – R&D, проверка гипотез и запуск новых инструментов и продуктов.

Наши задачи:

·      Исследуем вопросы эффективности и ищем закономерности в поведении команд, проверяем гипотезы;

·      Формулируем и внедряем метрики оценки эффективности производства;

·      Готовим данные для всех этапов обучения моделей (в т.ч. LLM);

·      Организуем всю разметку для своих моделей;

·      Инициируем различные эксперименты для обучения моделей;

·      Проектируем и реализуем новые B2E-продукты на базе ML/LLM под ключ, включая: Открытие новых продуктов, защита экономического обоснования; планирование, оценка сроков и рисков; полный цикл разработки от концепта до промышленной эксплуатации.

Обязанности

Обязанности:


  • Выстраивание стратегии по DS-части продуктов, развитие архитектуры ML-модели продуктов.
  • Определение требований к перечню, объему и качеству данных, необходимых для решения бизнес-задач.
  • Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения.
  • Оценка как полученное решение достигает поставленных целей.
  • Участие в разработке решения на основе обучения современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4).
  • Построение пайплайна обработки данных и обучения LLM (LLM цепочек).
  • Организация процесса мониторинга качества LLM.
  • Взаимодействие с другими участниками команды (DA / DE / BA / SA) для совместной работы (проверки гипотез, исследований, внедрения).
  • Внедрение успешных гипотез/моделей в промышленную эксплуатацию.
  • Следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике.
Требования

Требования:


  • Опыт работы в области DS от 3-х лет.
  • Знания в области теории вероятностей, статистики, оптимизации, численных методов.
  • Хорошие навыки программирования, знание Python (на уровне middle-разработчика), SQL.
  • Свободное владение основными DS библиотеками на Python, опыт применения алгоритмов машинного обучения, понимание их преимуществ, недостатков и ограничений.
  • Знание методов классического NLP, сильные навыки Prompt Engineering.
  • Опыт работы с LLM-моделями (LangChain, LLama, ChatGPT, GigaChat).
  • Уметь адаптировать в in-house формате доступные на рынке open source LLM-модели под задачи компании.
Условия

Условия

·      Новая молодая команда, с которой можно расти вместе.

·      Масштабные, сложные и разнообразные задачи.

·      Есть возможность влиять на развитие продукта и результат.

·      Конкурентную компенсацию (оклад и премии по результатам деятельности).

·      Свободный дресс-код.

·      Гибкий график для оптимального баланса работы и личной жизни.

·      Профессиональное обучение, семинары, тренинги, конференции, корпоративная библиотека.

·      ДМС, страхование жизни.

·      Самые инновационные, амбициозные проекты и задачи.