想象一个单一的AI模型,它可以在没有任何人类辅导或外部数据集的情况下自我提升推理能力。听起来像科幻小说? 好吧,Nvidia最新的研究正在通过一个名为多智能体进化(MAE)的突破性框架将这一切变为现实。 MAE:一个自我共同进化的系统,具有三个来自同一模型的角色: 1. 提议者:设计具有挑战性但可解决的问题 2. 解答者:通过逐步推理回答这些问题 3. 评判者:评估问题和解决方案,分配可靠的分数 这创造了一个内部生态系统,模型从自身输出中学习,不断提升其推理能力。 在Nvidia的Qwen 2.5-3B模型上,这种方法在多个基准测试中实现了令人印象深刻的+4.54%的准确率提升,超越了传统的监督微调。 更重要的是: ↳ 它的表现与依赖外部工具的更复杂自我对弈设置相匹配。 ↳ 它减少了对人类标签和外部环境的依赖。 ↳ 它展示了可扩展的、自我维持的AI发展,理想用于开放式推理任务。 这一突破将自我进化的AI定位为通向能够在多样化、复杂领域中自我提升的自主系统的有前景的路径。它暗示未来的AI模型能够适应、学习并在最小的人类干预下自我增强,就像生物进化一样,但在数字领域。