data engineer (scala)

21 ноября 2023 • г Москва • ПАО Сбербанк • IT: Data Science и Data Engineering

Мы занимаемся интереснейшим проектом CASHFLOW - платформы, созданной для анализа денежных потоков, связанных с выдачей кредитов Юридическим лицам (крупнейшему бизнесу РФ) на базе .NET, scala, Oracle, Postgre с использованием ML-технологий. (в мире таких 3 платформы, включая нашу). Создаем сейчас интегрированный слой детальных данных в DWH Сбера для предметных областей «Кредиты ЮЛ», «Залоги ЮЛ», «Гарантии ЮЛ». И сейчас в поисках коллеги, который в роли Data engineer усилит нашу команду:)

Обязанности

● Разрабатывать ETL-алгоритмы и витрины данных (Apache Spark, Hadoop)

● Оптимизировать и улучшать промышленные решения

● Документировать полученный результат

● Исправлять обнаруженные при эксплуатации дефекты

● Работать в распределенной команде и принимать активное участие в командных церемониях (daily в 10:30, «груминг», планирование спринта)

Требования

·      Умеете работать в Jira и вести разработку в Git

·      Глубоко понимаете принципы распределённой обработки данных

·      Обладаете широким кругозором в СУБД (включая noSQL, key-value и другие)

·      Имеете опыт работы со стеком Hadoop (Hive, oozie, HDFS, YARN etc)

·      Работали с фреймворком Apache Spark или Python и умеете создавать и оптимизировать etl-приложения с его помощью / готовы переходить с python на scala.

Условия

● гибрид/ офисный формат на ваш выбор

● скидка 4% от ставки ипотеки через 6 месяцев работы у нас

● годовая премия с кратными множителями

● красивый и комфортный офис

● Социальный пакет

● дисконт-программы от множества компаний партнеров.