Расскажу, как в Т-Бизнесе придумали концепции, позволившие выстроить общий подход к надежности сервисов: мониторинг и алертинг, прозрачные релизы, трекинг зависимостей и даже прототип автооткатов - в общем, почти всё, чтобы спокойнее спать по ночам).
Доклад рассчитан как на платформенные SRE-команды из BigTech, так и на начинающие команды, которым придётся поддерживать всё больше продуктовых сервисов по мере роста бизнеса.