Описание команды
SberData - департамент по управлению данными всего Сбербанка. SberData строит централизованное хранилище данных, объем которого уже превышает 10 ПБ. Это продуктово-ориентированная инженерная команда с функциями развития выделенных технологических направлений, отражающих новый подход Сбербанка к данным и к применению AI.
STORK - это команда, разрабатывающая собственный высокопроизводительный инструмент для потоковой передачи больших данных между реляционными СУБД и Hadoop.
С помощью нашего продукта Data Lake Сбербанка ежедневно пополняется сотнями терабайт свежих данных, которые используются для построения критичных бизнес-процессов и проверки гипотез в машинном обучении.
В ближайшее время перед нашей командой стоят амбициозные задачи по переходу на новый тех.стек продукта для перехода из пакетного в потоковый и NRT-режимы обработки данных.