Middle/Senior NLP-researcher в Sber AI Lab

10 июня 2024 • г Москва • ПАО "Сбербанк" • IT: Data Science и Data Engineering

Sber AI Lab - особое подразделение Сбера, нацеленное на наукоемкие AI проекты и создание новых технологий (в том числе и open-source). В Центре инструментов машинного обучения мы занимающийся разработкой в области технологий NLP, AutoML и RecSys.


В нашем центре мы развиваем следующие направления в области NLP: фактчекинг и улучшение фактологической точности генеративных моделей, авто-оценивание и авто-промптинг, анализ внутренних состояний LLM.

Обязанности

• Изучать актуальные академические статьи в области NLP и LLM;

• Участвовать в исследованиях и написании статей в журналы Q1/конференции A/A*;

• Технически планировать, анализировать и прорабатывать перспективные направления наукоемких исследований;

• Разрабатывать пайплайны для решения продуктовых кейсов с помощью больших языковых моделей;

• Придумывать и проверять ML-гипотезы для улучшения своего NLP пайплайна;

• Взаимодействие с прикладными командами по внедрению разработанных инструментов в банковскую инфраструктуру.

Требования

• Развитое алгоритмическое мышление;

• Хорошее знание языка Python (в том числе опыт работы с ML и DL framework-ами (NumPy, SciPy, Pandas, PyTorch, Tensorflow и пр.);

• Глубокое понимание основ DL и классического ML, широкий кругозор в ML в целом;

• Знание NLP методов и желание совершенствоваться в этой области: методы позиционного кодирования, варианты механизмов внимания, методы работы с длинным контекстом, опыт работы с parameter-efficient тюнингом (LoRA, QLoRA, prompt tuning, prefix tuning), методами распределенного обучения (Pipeline, Tensor, Model Parallelism), базовое понимание DeepSpeed и Accelerate, понимание LLM-агентов (RAG, function calling/tools);

• Опыт применения генеративных NLP моделей в бизнес-процессах;

• Опыт работы с инструментами разработки (ubuntu / bash / git / docker) или желание освоить эти навыки.


Приветствуется:

• Опыт участия в соревнованиях (Kaggle и прочее), завершенных R&D и/или исследовательских проектов будет плюсом;

• Наличие ученой степени или обучение в аспирантуре по тематике ИИ как плюс.

Условия
  • Профессиональный коллектив (в группе разработки AutoML работают грандмастера и мастера Kaggle);
  • Действительно интересные задачи на передовой научной деятельности, активная работа с новыми технологиями;
  • Возможность совмещать работу с соревнованиями на Kaggle и написанием научных статей;
  • Участие в международных научных конференциях;
  • Социальный пакет: ДМС с первого дня, спортзал (фитнес, йога, кроссфит), возможность обучения за счет компании, льготные условия кредитования;
  • Специальные условия ДМС для ближайших родственников сотрудника;
  • Высокие премии по итогам успешной работы.