«Більше, ніж DNS: 14-годинний збій AWS us-east-1» Джонатана Белотті @jonobelotti_IO Хороша спроба розібратися в досить тупому звіті Amazon. Посмертні дослідження в програмному забезпеченні не повинні використовувати RCA (root cause analysis), а замість цього використовувати рамки: • Механізм: безпосередній процес, який призвів до простою/збою (наприклад, нульовий запис DNS) • Причина: специфічний недолік, який призвів до механістичних змін (наприклад, стан перегонів) • Спосіб: обставини, пов'язані з недоліком або як він стався (наприклад, помилка кодування, помилка людини-оператора, апаратний збій тощо) RCA – занадто грубий інструмент. Повний пост після перерви...