Data Scientist (Middle\Senior)
08 ноября 2023 • г Москва • ПАО Сбербанк • IT: Data Science и Data Engineering
Команда продукта «Интеллектуальная система управления руководителя» занимается созданием продукта, разработка которого включает:
- Data-решения
- AI-сервисы для инструментов руководителя от идеи до промышленной эксплуатации,
- Решения с использованием сервисов партнеров экосистемы
- Трекер задач
- Инструменты оценки встреч и обратной связи, реализующие принципы прозрачности в рамках follow-up менеджмента
Обязанности
- разработка дизайна ML системы из множества ML моделей в рамках единого продукта («Интеллектуальная система управления руководителя»);
- консультирование / участие в автоматизации источников данных для ML моделей совместно с ML Engineer/Data Engineer;
- full-stack разработка ML моделей, доведение моделей из стадии MVP до целевого решения (все этапы ЖЦ моделей по CRISP-DM от Data Understanding до Deployment с использованием тех. стека банка);
- NLP-задачи: Preprocessing, Classification, Summarization (Ext/Abst), Sentence Compression, Simplification, NER, Semantic Search, Clustering;
- Domain Adaptation и инструктивное дообучение большой языковой модели Сбера (Generative + Extractive, ChatGPT-like) с использованием внешних/внутренних данных;
- Text2Code (внешняя память ChatGPT-like модели на основе динамических блоков);
- индексация и ранжирование на массиве документов (.pdf, .docx, .rtf и др.).
- тесное взаимодействие с бизнес-заказчиком для выявления требований к AI-компоненте продукта и самостоятельная постановка задачи на основании извлечения vision;
- участие в разработке архитектуры решения в части AI-компоненты (технологический стек для развертывания моделей в средах исполнения);
- участие в стримах по валидации разработанных моделей и постановке их на автомониторинг.
Требования
- высшее техническое образование в сфере компьютерных наук, прикладной математики или статистики;
- опыт в разработке NLP моделей и рекомендательных систем (желательно);
- понимание жизненного цикла моделей (CRISP-DM);
- умение переводить бизнес-постановку задачи в ML-постановку, грамотная интерпретация полученных результатов;
- высокий уровень владения ядром Python и SQL;
- свободное владение базовыми библиотеками на Python, в том числе: pandas, numpy, matplotlib, seaborn;
- знание фреймворков, библиотек, алгоритмов машинного обучения: Scikit-learn, Pytorch, XGBoost, CatBoost, TensorFlow, transformers;
- опыт работы с NLP библиотеками: pymorphy2, NLTK, Gensim, spaCy, regexp;
- знание архитектур нейронных сетей LSTM, трансформеры (BERT, BART);
- контейнеризация: Docker, OpenShift;
- Linux;
- инструменты DevOps (MLOps): Git, Jira, Bitbucket, Nexus, Jenkins;
- индустриальный опыт разработки, обучения, тестирования, выведения моделей в эксплуатацию и мониторинга качества (не менее 3-х лет);
- технический английский статьи, документация);
- преимущество: pet-projects на Github, владение Confluence, Jira, медали на Kaggle, готовность брать на себя коммуникацию с бизнес-заказчиком, опыт DS-менторства
Условия
- Ипотека выгоднее на 4% для каждого сотрудника и льготные условия кредитования;
- Бесплатная подписка СберПрайм+;
- Скидки на продукты компаний-партнеров;
- ДМС с первого дня и льготное страхование для близких;
- Корпоративная пенсионная программа;
- Обучение за счет Компании: онлайн курсы в Виртуальной школе Сбера и неограниченный доступ к библиотеке, обучение в Корпоративном университете, Тренинги, митапы и возможность получить новую квалификацию;
- Крупнейшее DS&AI community - более 600 DS банка, включая: регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы