Руководитель команды SRE в облачную инфраструктуру SberInfra (InfraCloud)

07 февраля 2024 • г Москва • ПАО "Сбербанк" • IT: Разработка

Облачная платформа InfraCloud является фундаментом для всех сервисов группы компании Сбер. Мы помогаем создавать и развивать цифровые сервисы и приложения для всей экосистемы. Наша команда разрабатывает ключевые сервисы облачной инфраструктуры от самых базовых инфраструктурных, до платформенных и интеграционных. Мы стремимся сделать из внутреннего облака тесную интегрированную платформу, с помощью которой разработчики и инженеры эксплуатации наших клиентов смогут удобно и надежно разрабатывать и эксплуатировать свои сервисы, как стандартные механизмы API/UI, так и подходы Infrastructure as Code.

Мы ищем человека на позицию руководителя для Site Reliability Engineering команды который разбирается в создании и эксплуатации больших отказоустойчивых систем. Наши команды фокусируются не только на надежности, но и эффективности и удобстве сервисов. Чтобы совершенствовать эти характеристики мы совершенствуем автоматизацию релизов, инструменты мониторинга и observabilty. Вы будете строить гибридное облако и помогать делать его надежнее и эффективнее.

Обязанности
  • руководить командой SRE и управлять метриками доступности и эффективности операций сервисов InfraCloud;
  • end-to-end контроль доступности и производительности сервисов для построения автоматизации их мониторинга и предотвращения инцидентов;
  • заниматься исследованиями и доработками, чтобы разворачивать наши инфраструктурные сервисы вне основной инфраструктуры Сбера;
  • помогать расследовать причины инцидентов;
  • предлагать и воплощать в жизнь меры по их предотвращению;
  • помогать разработчикам проектировать производительные и отказоустойчивые решения;
  • нанимать и развивать команды SRE.
  • опыт работы с Linux-системами более пяти лет;
  • владение Python или Go языками программирования;
  • опыт внедрения и поддержки процессов CI/CD в промышленной эксплуатации;
  • опыт более двух лет в управлении командой, лидирование проекта, дизайне и эксплуатации распределенных систем;
  • здоровый перфекционизм и желание сделать мир лучше;
  • умение легко находить общий язык с людьми;
  • организованность и инициативность.


Будет плюсом, если вы:

  • хорошо знаете структуры данных и алгоритмы;
  • работали с Kubernetes или OpenShift;
  • использовали Infrastructure-as-Code подходы;
  • знаете что такое сеть в принципе, разбираетесь в протоколах (TCP, UDP, DHCP, BGP, DNS);
  • имеете базовые знания безопасной разработки и основы криптографии.
Условия
  • работа в офисе БЦ «Южный Порт» (7 минут пешком от ст. м. Кожуховская), график 5/2, отсутствие строгого дресс-кода, возможен смешанный график работы;
  • стабильный оклад и социальную поддержку сотрудников;
  • расширенный ДМС с первого дня работы для сотрудников и льготная медицинская страховка для близких;
  • ипотека выгоднее на 4 п.п. и льготные условия кредитования для каждого сотрудника;
  • бесплатная подписку СберПрайм+, скидки на продукты компаний-партнеров: Сбер Маркет, Delivery Club, Самокат, Сбер Еаптека и других
  • корпоративная пенсионная программа;
  • корпоративное обучение за счет компании;
  • реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 100 тыс. рублей;
  • официальное оформление с первого дня;
  • корпоративный спортзал и скидки в спортзалы-партнеры;
  • скидки на продукты Сбера и компаний экосистемы