Расскажу, как мы в Дежурной службе Облака Selectel справляемся с сотнями алертов в сутки:
- проблемы в работе с мониторингом и их решения
- автоматизация процесса доставки уведомления дежурному
- наш опыт работы с проприетарными системами управления инцидентами
- конкретный кейс переезда на Grafana Oncall OSS
- сложности перехода на Open Source
Доклад рассчитан на владельцев критичных сервисов, тимлидов и системных администраторов команд, работающих с мониторингом и сообщениями от него. Слушатели:
- узнают как устроен мониторинг крупной облачной инфраструктуры Selectel
- смогут использовать наш опыт работы с сообщениями мониторинга и взаимодействия между командами
- услышат о доступных альтернативах платным зарубежным системам управления инцидентами