Надежность на масштабе: как шесть SRE шестьсот сервисов держали
Тезисы
Расскажу, как в Т-Бизнесе придумали концепции, позволившие выстроить общий подход к надежности сервисов: мониторинг и алертинг, прозрачные релизы, трекинг зависимостей и даже прототип автооткатов - в общем, почти всё, чтобы спокойнее спать по ночам).
Доклад рассчитан как на платформенные SRE-команды из BigTech, так и на начинающие команды, которым придётся поддерживать всё больше продуктовых сервисов по мере роста бизнеса.
Расскажу, как в Т-Бизнесе придумали концепции, позволившие выстроить общий подход к надежности сервисов: мониторинг и алертинг, прозрачные релизы, трекинг зависимостей и даже прототип автооткатов - в общем, почти всё, чтобы спокойнее спать по ночам).
Доклад рассчитан как на платформенные SRE-команды из BigTech, так и на начинающие команды, которым придётся поддерживать всё больше продуктовых сервисов по мере роста бизнеса.
Информация о спикере
Егор Петров
Site Reliability Engineer, Т-Банк
  • Егор Петров
    Site Reliability Engineer, Т-Банк
Все доклады секции