人工分析在@latentspacepod的最新一集中与@Swyx对话。 创始人@_micah_h和@grmcameron讨论了: ➤ 人工分析的起源故事 ➤ AI基准测试的现状 ➤ 我们最新的基准测试,包括AA-Omniscience、GDPval-AA和开放指数 链接如下!