Site Reliability Engineer (SRE)

12 февраля 2024 • г Нижний Новгород, Нижегородская область • ПАО "Сбербанк" • IT: Поддержка, DevOps и администрирование

О проекте

Мы - динамично растущая команда экспертов в области построения рекомендательных систем


Наша главная цель - построить современную, масштабируемую платформу, которая будет постоянно предвосхищать и превосходить ожидания пользователей, предоставляя им персонализированный и релевантный контент на всем клиентском пути


Наша платформа будет обслуживать широкий круг потребителей и строить персональные рекомендации во всех сферах бизнеса, таких как музыка, фильмы, онлайн торговля, медицина, логистика и многих других, которые присутствуют в быстро растущей экосистеме


Если ты мечтаешь поучаствовать в создании такой рекомендательной системы, то тебе к нам!

Обязанности

Что предстоит делать:

Базис создания такой системы – это отказоустойчивая и производительная инфраструктура в облаке, где эта система работает

Проектирование, разработка и непрерывное развитие инфраструктуры – обязательные условия функционирования системы для миллионов её пользователей

Ты будешь работать над созданием компонентов этой инфраструктуры, над их наблюдаемостью, над обеспечением доступности, автоматическим масштабированием и обеспечением работы под нагрузкой в десятки тысяч обращений в секунду


Мы ищем экспертов и энтузиастов в области Site Reliability Engineering, кто ставит своей основной целью работать и развиваться в области построения сложных высоконагруженных систем

У тебя будет возможность исследовать современные подходы и практики SRE, общаться с коллегами из других проектов, участвовать в конференциях и применять полученные знания на практике

Требования

Что для нас важно:


  • Знание основных принципов и практик SRE
  • Уверенная техническая экспертиза в одном или нескольких направлениях (Kubernetes, сети, разработка ПО, Infrastructure as Code, системное администрирование Linux)
  • Навыки работы с системами мониторинга и логирования (Prometheus, Loki, Grafana)
  • Готовность к дежурствам по алертам мониторинга
  • Опыт работы с облаками (AWS, GCP, Azure)
  • Опыт работы с любой системой автоматизированного управления инфраструктурами Ansible/Terraform
  • Уверенная работа с Git
  • Опыт администрирования Linux (Ubuntu)


Будет плюсом:


  • Опыт работы с базами данных SQL и NoSQL
  • Понимание основных принципов работы с ML и инструментов (AirFlow, Seldon, ML Flow, Apache Spark)
  • Навыки разработки на Golang/Python
  • Знание работы сетей и сетевых протоколов (TCP/IP, HTTP(S), VPN)
  • Опыт работы с облаками Yandex Cloud, Cloud Mail.ru, VK Cloud, Cloud.ru
  • Уверенное владение инструментами Atlassian Jira и Confluence для ведения задач и документации
  • Опыт промышленной эксплуатации высоконагруженных сложных ИТ-сервисов
Условия

Мы предлагаем:


  • Стабильный доход и социальная поддержка сотрудников
  • Расширенный ДМС с первого дня работы для сотрудников и льготная медицинская страховка для близких
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • Корпоративная пенсионная программа
  • Корпоративное обучение за счет компании
  • Реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 100 тыс. рублей
  • Мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы
  • Работу по Agile с лучшими из IT индустрии: 2000 продуктовых команд и возможность внутреннего перемещения
  • Возможность выбрать удобный формат работы: гибрид или офис
  • Комфортный офис, бесплатные снеки, спортзалы с бассейнами
  • Офис: г. Нижний Новгород, ул. Бекетова 13В