週末に、AWSは自社のAIエージェントの一人が本番環境の処理を途中で削除したことで話題になりました。 障害は13時間続きました。 これが世界の計算が3社に集中すると起こることです。🧵
2 / 2026年入り2ヶ月未満: • Azure:1月に4回の障害、2月に1つのデータセンターの故障による20時間の障害 • AWS:4+件のインシデントが20+サービスに連鎖的に発生 • Google Cloud:1つのIAMミス設定により、Gemini、BigQuery、Firestore、App Engineが世界中で停止 わずか54日で、これら3つのプロバイダーはすでに40+時間のインターネットダウンを引き起こしています。
3/ ハイパースケーラーはコアインフラから資本をAI構築に流用し、企業が同意していないリスクを負わせています。 エンタープライズのワークロードの94%は3つのプロバイダーで動作しています。 設定ミス、エージェントの不正、停電が一度にすべてをダウンさせることがあります。
4/ 1つのシステムがすべてのサービス、ユーザー、APIコールの認証を同時に処理すると、1つの誤設定で接続されたすべてのものが壊れます。 分散型計算はそうは機能しません。失敗は局所的に限られます。 260,000+ノード。検証可能だ。常にオン。 ComputeFi。
40