5 marca pojedyncze narzędzie do kodowania AI spowodowało 99% spadek zamówień w północnoamerykańskich rynkach Amazon, eliminując 6,3 miliona zamówień w jeden dzień. Narzędzie zostało poproszone o wprowadzenie drobnych zmian i zniszczyło całe środowisko w tym procesie, co spowodowało 13-godzinne przywracanie. Dla firmy przetwarzającej około 4000 dolarów sprzedaży na sekundę, ma to bardzo konkretną wartość pieniężną. Amazon zwołuje teraz obowiązkowe spotkanie inżynieryjne dla wszystkich pracowników w tej sprawie, nazywając je "rutynowym." Ich wewnętrzna notatka informacyjna opowiada inną historię: wzór awarii wspomaganych przez AI z szerokimi szkodami i brakiem ustalonych zabezpieczeń, aby ich zapobiec. Ale dlaczego to ma znaczenie poza Amazonem? Każde duże przedsiębiorstwo obecnie wdraża narzędzia AI w systemach, które nigdy nie były do tego zaprojektowane. Większość działa szybko, zakładając, że ryzyko jest zarządzalne, aż do dnia takiego jak 5 marca, który udowadnia coś innego. Popełnienie błędu na taką skalę jak Amazon to problem z przychodami, problem operacyjny i ostatecznie problem odpowiedzialności kierownictwa. Co więc Amazon właściwie robi w tej sprawie? SVP Dave Treadwell rozpoczął udokumentowaną 90-dniową przebudowę w 335 krytycznych systemach skierowanych do klientów, zapisując to na piśmie dla pracowników: • Dwaj koledzy muszą zatwierdzić, zanim zmiana kodu wejdzie w życie • Automatyczne kontrole egzekwują zasady niezawodności przed wdrożeniem • Formalne narzędzia zarządzania zmianami są teraz obowiązkowe w całym zakresie • Każdy lider na poziomie dyrektora i VP musi audytować wszystkie zmiany kodu produkcyjnego w swojej organizacji Po 90 dniach Amazon buduje twarde granice wokół swoich narzędzi AI. Ponieważ gdy błędy kosztują prawdziwe pieniądze, zabezpieczenia nie są opcjonalne.