В SberData мы создаем платформы данных для всего Сбера. Это более 350 источников данных и 100+ Пб информации, заказ и получение данных за 15 минут и современных технологический стек работы с данными, включая собственные сборки СУБД на базе Hadoop и GreenPlum. Наша компанда развивает инструменты и внедряет технологию разделенного Compute & Storage в рамках концепции Lakehouse. Наша задача - разработать и внедрить надежное, безопасное решение для высонагруженных расчетов витрин данных на современных технологиях Compute (Spark, Flink) и Storage (S3), работающее более чем на 10000 серверах.