Мы занимаемся интереснейшим проектом CASHFLOW - платформы, созданной для анализа денежных потоков, связанных с выдачей кредитов Юридическим лицам (крупнейшему бизнесу РФ) на базе .NET, scala, Oracle, Postgre с использованием ML-технологий. (в мире таких 3 платформы, включая нашу). Создаем сейчас интегрированный слой детальных данных в DWH Сбера для предметных областей «Кредиты ЮЛ», «Залоги ЮЛ», «Гарантии ЮЛ». И сейчас в поисках коллеги, который в роли Data engineer усилит нашу команду:)
● Разрабатывать ETL-алгоритмы и витрины данных (Apache Spark, Hadoop)
● Оптимизировать и улучшать промышленные решения
● Документировать полученный результат
● Исправлять обнаруженные при эксплуатации дефекты
● Работать в распределенной команде и принимать активное участие в командных церемониях (daily в 10:30, «груминг», планирование спринта)
· Умеете работать в Jira и вести разработку в Git
· Глубоко понимаете принципы распределённой обработки данных
· Обладаете широким кругозором в СУБД (включая noSQL, key-value и другие)
· Имеете опыт работы со стеком Hadoop (Hive, oozie, HDFS, YARN etc)
· Работали с фреймворком Apache Spark или Python и умеете создавать и оптимизировать etl-приложения с его помощью / готовы переходить с python на scala.
● гибрид/ офисный формат на ваш выбор
● скидка 4% от ставки ипотеки через 6 месяцев работы у нас
● годовая премия с кратными множителями
● красивый и комфортный офис
● Социальный пакет
● дисконт-программы от множества компаний партнеров.