🚨Opus 4.6はサイバーセキュリティチーム全体を上回る性能を発揮しました。 22匹の虫。14の重症度です。14日間。 よく考えてみて。 そしてそれは彼らを見つけるだけでは終わりませんでした。 パッチも書いていました。 うまくいった理由は以下の通りです: → Claudeはタスク検証ツールを使って自社の作業をチェックしていました → バグが実際に修正されたことを確認しました → 他に壊れたものはなかったことを確認しました → 最小限のテストケースと詳細な概念実証を各報告書に添えて提出しました Firefoxチームはこれらの投稿を信頼できると評価しました。 それは小さなことではありません。 ほとんどの人間の研究者はその基準で提出しません。 サイバーセキュリティエンジニアは年間20万ドルの料金を請求します。 クロードは毎年恒例の仕事を14日で終えた。