Anthropicは16人のAIエージェントにCコンパイラを一から作らせました。10万行、Linuxカーネルのコンパイル、2万ドル、2週間。 比較すると、GCCは37年以上にわたり何千人ものエンジニアを費やして建設しました。(ただし1987年からは付与)1人の研究者と16人のAIエージェントが、GCCの拷問テストスイートの99%をクリアし、FFmpeg、Redis、PostgreSQL、QEMUをコンパイルし、Doomを動かすコンパイラを作り上げました。 彼らは「(ほとんど)立ち去った」と言っています。しかし、その「ほとんど」は重い仕事をしているのです。 人間がコードを書いたわけではなく、研究者は常にテストを再設計し、エージェント同士の作業が壊れたときにはCIパイプラインを構築し、16人のエージェント全員が同じバグに引っかかる場合は回避策を作っていました。 人間としての役割は消えなかった。それはコードを書くことから、AIがコードを書ける環境の設計へとシフトしました。 AIが壁にぶつかっているという点をどう説明できるのか分かりません。