"Více než DNS: 14hodinový výpadek AWS us-east-1" od Jonathona Belottiho @jonobelotti_IO Dobrý pokus dát smysl poněkud tupé zprávě Amazonu. Pitva v softwaru/operacích by neměla používat RCA (analýzu kořenových příčin), ale místo toho používat rámec: • Mechanismus: Okamžitý proces, který vedl k výpadku/selhání (např. nulová položka DNS) • Příčina: Konkrétní chyba, která vedla k mechanickým změnám (např. stav závodu) • Způsob: Okolnosti chyby nebo způsob, jakým k ní došlo (např. chyba v kódování, chyba lidského operátora, selhání hardwaru atd.) RCA je příliš hrubý nástroj. Celý příspěvek po přestávce...