Anthropic 讓 16 個 AI 代理從零開始建立了一個 C 編譯器。100,000 行,能編譯 Linux 核心,花費 20,000 美元,耗時 2 週。 為了讓這個情況更具體,GCC 花了數千名工程師 37 年的時間來建立。(雖然是從 1987 年開始)但一位研究人員和 16 個 AI 代理剛剛建立了一個編譯器,通過了 99% 的 GCC 自己的折磨測試套件,能編譯 FFmpeg、Redis、PostgreSQL、QEMU 並運行 Doom。 他們說他們「(大部分)走開了。」但那個「大部分」在這裡承擔了重任。 沒有任何人寫代碼,但研究人員不斷重新設計測試,當代理互相破壞工作時建立 CI 管道,並在所有 16 個代理都卡在同一個錯誤時創建解決方案。 人類的角色並沒有消失。它從寫代碼轉變為工程環境,讓 AI 能夠寫代碼。 我不知道你怎麼能表達 AI 正在碰壁的觀點。