人们在评估AI研究进展时最常犯的错误之一是只关注某一类任务的进展,并将其外推到人类能够完成的所有任务上。 AI的进展在特定领域内极为垂直。在过去一年中,可验证领域,尤其是代码,显示出快速的进展,但这种进展并未扩展到其他领域。这是因为,至今为止,AI能力的主要驱动因素仍然是对过去数据的记忆和操作,而在可验证领域,这些数据可以以无限的数量生成。