Егор Петров. Надежность на масштабе: как шесть SRE шестьсот сервисов держали

Надежность на масштабе: как шесть SRE шестьсот сервисов держали

Тезисы

Расскажу, как в Т-Бизнесе придумали концепции, позволившие выстроить общий подход к надежности сервисов: мониторинг и алертинг, прозрачные релизы, трекинг зависимостей и даже прототип автооткатов - в общем, почти всё, чтобы спокойнее спать по ночам).
Доклад рассчитан как на платформенные SRE-команды из BigTech, так и на начинающие команды, которым придётся поддерживать всё больше продуктовых сервисов по мере роста бизнеса.

Информация о спикере

Егор Петров

Site Reliability Engineer, Т-Банк

Егор Петров

Site Reliability Engineer, Т-Банк

Все доклады секции