Знаете это чувство, когда надо на лету сменить систему хранения данных с сотнями TB данных в top-10 critical сервисе? Процесс этот опасный, страшный, но необходимый в некоторых случаях.
В нашей команде мы такие переключения производим достаточно часто. И чтоб упростить себе жизнь, мизимизировать дрожание рук и количество инцидентов, мы разработали план-чеклист и придерживаемся его.
На примере смены системы хранения со всеми картинками Авито размером в 5 Pb мы с вами пройдемся по чек-листу, обоснуем необходимость каждого шага и разберём, к каким инцидентам и проблемам приводил (или мог привести) пропуск каждого пункта.