Data Quality Engineer

08 мая 2026 • г Москва • ПАО Сбербанк • IT: Data Science и Data Engineering

В трайбе SberWorks (Сбер) мы создаём Productivity Platform — единую платформу для автоматизации производственных процессов и внедрения искусственного интеллекта в Сбере. В основе платформы лежит DataLake — централизованное хранилище, которое накапливает и структурирует данные для аналитики, обучения AI-ассистентов и построения витрин.


Цель создания платформы Productivity Platform — обеспечить единый и бесшовный путь для команд Банка, сократив производственные затраты благодаря максимальной автоматизации и применению искусственного интеллекта на каждом этапе производственного процесса.


Команда DataLake отвечает за развитие и сопровождение холодного хранилища на базе Hadoop. Мы ищем специалиста, который поможет нам развить с нуля практики тестирования данных в нашей системе и выстроить процессы обеспечения качества данных на всех этапах их жизненного цикла.

Стек технологий проекта: Python, PySpark, Airflow, Hadoop (Hive), Kafka, Postgres, CDC, OpenMetaData

Обязанности

·       Разрабатывать и поддерживать автоматизированные тесты Data Quality для данных, хранящихся в Hadoop (Hive).

·       Интегрировать тесты в Airflow-пайплайны, обеспечивать их запуск по расписанию и мониторинг результатов.

·       Анализировать причины инцидентов с качеством данных, взаимодействовать с владельцами источников и потребителями данных.

·       Разрабатывать и внедрять метрики, правила и стандарты качества данных для DataLake.

·       Участвовать в развитии инфраструктуры тестирования данных, внедрять новые инструменты и подходы.

Требования

·       Опыт работы с Hadoop/Hive, понимание принципов организации данных в DWH.

·       Уверенное владение Python и PySpark для написания тестов и обработки данных.

·       Опыт работы с Airflow: создание, отладка и поддержка DAG’ов.

·       Понимание принципов тестирования данных (Data Quality), опыт разработки автотестов для ETL-процессов.

·       Навыки работы с SQL, опыт анализа данных и поиска аномалий.

·       Будет плюсом: опыт работы с Kafka, CDC, Postgres.

·       Будешь стремиться погружаться в продукт, а не "просто писать код"

Условия

·       Современный комфортный офис рядом с м. Кутузовская.

·       Ежегодный пересмотр зарплаты и годовая премия

·       Более 400 образовательных программ СберУниверситета. Возможность постоянно совершенствоваться и развивать профессиональные навыки.

·       Программа адаптации и помощь руководителя на старте. Мы поможем вам быстро влиться в коллектив и начать продуктивную работу.

·       Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа. Забота о вас и ваших близких — важный аспект нашего сотрудничества.

·       Корпоративный спортзал и зоны отдыха.

·       Ипотека выгоднее до 7% для каждого сотрудника. Специальные условия ипотечного кредитования сделают покупку жилья доступной.

·       Подписка СберПрайм+, скидки на продукты компаний-партнеров

·       Вознаграждение за рекомендацию друзей в команду Сбера. Привлекая новых талантливых специалистов, вы можете заработать дополнительное вознаграждение.