Anthropic让16个AI代理从头开始构建一个C编译器。100k行,能够编译Linux内核,花费$20k,耗时2周。 为了更好地理解,GCC花费了数千名工程师37年才构建完成。(虽然是从1987年开始的)但一位研究人员和16个AI代理刚刚构建了一个编译器,能够通过99%的GCC自身的折磨测试套件,编译FFmpeg、Redis、PostgreSQL、QEMU,并运行Doom。 他们说他们“(大部分)走开了。”但这个“主要”承担了很大的责任。 没有人类编写代码,但研究人员不断重新设计测试,构建CI管道,当代理们破坏彼此的工作时,并在所有16个代理都卡在同一个错误时创造解决方法。 人类的角色并没有消失。它从编写代码转变为工程环境,让AI编写代码。 我不知道你怎么能说明AI正在碰壁。