Project Manager (внутренние проекты)

27 февраля 2024 • г Москва • ПАО "Сбербанк" • IT: Разработка

Кого мы ищем?

Мы ищем опытного и проактивного менеджера проектов по исследованию и аналитике данных в команду, специализирующуюся на разработке NLP-сервисов с применением самого современного технологического стека, в том числе – больших языковых моделей (LLM).

Кто мы?

Наша междисциплинарная команда: юристов, лингвистов, разработчиков и исследователей данных создаёт семейство продуктов, позволяющих автоматизировать разнообразные правовые экспертизы. Мы накопили обширную экспертизу в области применения трансформерных моделей для решения иерархических NER-задач – решения на базе наших моделей участвуют в формировании сделок на сумму более 5 млрд. рублей в год. Сейчас одними из первых в мире реализуем семейство юридических сервисов на базе LLM и находимся в стадии активного внедрения новых технологических решений для юридического домена как внутри Сбера, так и для внешних клиентов.

Эта вакансия для тебя, если ты:

·       Готов проявлять инициативу, предлагать новое и брать ответственность.

У нас сильная команда, где каждый может повлиять на итоговое решение. От менеджера проектов мы ждем генерации новых инициатив, последовательности и скрупулезности в их реализации.

·       Готов выходить за рамки и ограничения.

В любой корпоративной среде есть ряд устоявшихся норм и правил. Способность мыслить вне шаблонов, рамок и ограничений – это то качество, которое выделяет лидера среди других.

·       Нацелен на результат.

Мы совершенствуем технологии машинного обучения не только потому, что мы любим проверять гипотезы и создавать что-то новое. Наша цель – создание на базе алгоритмов новые решения, приносящие конкретную практическую пользу нашим клиентам. 

·       Ты понимаешь, как измерять результаты работы команды и знаешь, что такое продуктовые метрики

Между обучением ML-моделей и созданием конечного продукта часто лежит огромная пропасть. При этом важно понимать, с помощью каких метрик можно оценить технологические нововведения и как они влияют на конечного пользователя.

·       Ты постоянно совершенствуешься.

Как писал Льюис Кэрролл: «чтобы оставаться на месте, нужно бежать. Чтобы дойти куда-либо, нужно бежать в два раза быстрее». Это очень точно описывает ситуацию в высокотехнологичной отрасли, где нужно постоянно быть на острие инноваций, чтобы сохранять конкурентоспособность.

Требования

Ожидания от кандидатов:

·       Развитый кругозор и общая осведомленность о технологиях глубокого обучения (Deep Learning)

·       Понимание основных классических и нейросетевых алгоритмов машинного обучения, самых популярных ML-фреймворков (PyTorch, TensorFlow) и актуальных нейросетевых моделей (трансформеры, большие языковые модели (LLM))

·       Развитые коммуникационные навыки, способность продуктивно общаться с разными аудиториями: клиентами (юристами), разработчиками, топ-менеджментом компании

·       Стратегическое мышление: умение ставить цели, декомпозировать их на задачи, контролировать их исполнение

·       Системное мышление, структурность и скрупулезность

Требования

Наши ожидания от кандидатов:

●      Реальный опыт разработки NLP-моделей, знание SOTA-подходов, умение их объяснить команде

●      Отлично знание основ Data Science — от линейной алгебры и теории вероятностей до DNN

●      Понимание архитектуры и принципов устройства и обучения больших лингвистических моделей (LLM) и генеративных трансформеров типа GPT/Bert: Tokenizing, Position Encoding, (Masked) Multihead Attention, Batch/Layer Normalization и т.д.

●      Понимание принципов обучения и применения моделей обучения с подкреплением (Reinforced Learning)

●      Понимание основных методов Machine Learning (regressions, clustering, decision trees, и т.д.), уверенное знание когда их применять, а когда не надо

●      Умение выстраивать Pipe Line машинного обучения и быстрое развертывание их в применении к GPT-подобным моделям — Domain Data Mining / Augmentation / Unsupervised Learning/ SFT / RLHF / Validation / Self Confidence / Active Learning

●      Оценка вычислительной сложности всего Pipe Line, применение классических алгоритмов для ее снижения

●      Знание Computer Science на уровне, позволяющем управлять командой разработчиков — от понимание классических алгоритмов до Unit Tests, Refactoring и основ Devops

●      Готовность браться за нестандартные, сложные задачи (поддержка актуальных знаний в весах моделей (Active Learning) или на внешней дифференцируемой памяти по принципу Query-Key-Value, доверие к Confidence решений, способы преодолеть Token Window Size и другие.)

●      Быстро проверять гипотезы на небольших мощностях и масштабировать успешные решения.

●      Готовность работать в команде и применять Git, Jira, Confluence и другие средства командной работы

●      Высокая степень самоорганизации

Текущий статус

Наши AI-решения применяются в флагманском продукте Сбера «Онлайн-кредитование» для корпоративных клиентов, обеспечивая принятие решений в автоматическом режиме по 60% от всех кредитных сделок банка.

Мы уделяем особое внимание сбору и подготовке датасета: мы собрали обширный набор юридических данных, на которых обучили собственный трансформер-энкодер LegalBERT, также у нас есть собственный инструмент разметки, который позволяет задействовать несколько десятков in-house разметчиков для создания различных NLP-датасетов.

Команда

У нас работают NLP-исследователи, разработчики, юристы и лингвисты — выпускники лучших российских вузов, участники конкурсов и хакатонов. Так, наша команда победила в хакатоне «Лидеры цифровой трансформации», организованном Правительством Москвы в 2022 году.

Условия

Что мы предлагаем

●      Страшно интересные NLP задачи в самой сложной области предметных знаний (GPT + Legal domain).

●      Возможность обучения и развития, участия в конференциях от Сбера.

●      Уютный офис с печеньками, столовой и спортзалом.

●      Социальный пакет (ДМС, фитнес, льготное страхование).