我们的 Huxley-Gödel 机器学习重写自己的代码,评估自身长期自我改进的潜力。它在新任务(SWE-Bench Lite)上进行泛化,匹配最佳的官方检查人类工程代理。Arxiv 2510.21614 与 @Wenyi_AI_Wang, @PiotrPiekosAI, @nbl_ai, Firas Laakom, @Beastlyprime, @MatOstasze, @MingchenZhuge