热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Noam Brown
研究推理 @OpenAI |共同创建了 Libratus/Pluribus 超人扑克 AI、CICERO Diplomacy AI 和 OpenAI o3 / o1 / 🍓 推理模型
在你看到一个人工智能掌握你深切关心的领域之前,很难“感受到AGI”。每个人都会在不同的时间经历他们的李世石时刻。

Dave White7月22日 08:59
这个周末,openai IMO 的新闻让我感到很沉重。
我想我仍然处于影响的急性阶段。
我认为自己是一个专业的数学家(一些真正的专业数学家可能会对此有异议,但这是我的派对,我的规则),而我觉得我无法回答一个 IMO 问题。
好吧,是的,IMO 是数学的一个小型运动子集,我没有经过训练等等,但如果我在外面遇到一个获得 IMO 金牌的人,我会立即更新为“这个人在数学上比我强得多”。
现在一堆机器人可以做到这一点。作为一个在“擅长数学”上建立了很多身份和实际生活的人,这真是个重击。这是一种死亡的感觉。
就像,有一天你发现你可以和狗说话。这很有趣,所以你做得更多,学习它们语言的细微差别和最深的习俗。你发现其他人对你能做的事情感到惊讶。你从未完全融入,但你了解到人们欣赏你的能力,并希望你在身边帮助他们。狗也很欣赏你,唯一一个真正理解它们的双足动物。你为自己组建了一种归属感。然后有一天你醒来,发现通用狗翻译器在沃尔玛以 4.99 美元的价格出售。
IMO 的结果并不算新闻。事实上,如果你查看 METR 代理任务长度随时间变化的图表,我认为代理能够解决大约 1.5 小时的问题正好是按时到来的。因此在某种程度上我们不应该感到惊讶。实际上,似乎有多家公司达到了同样的结果。只是……潮水上涨得如此之快。
当然,对我作为数学家的个人身份(和/或社会的生产性成员)的悲伤是这个故事中最小的一部分。
将这种悲伤乘以每一个数学家,每一个程序员,也许每一个知识工作者,每一个艺术家……在接下来的几年里……这是一个稍微更大的故事。
当然,除此之外,还有对实际死亡的恐惧,也许我稍后会详细讨论。
这种包裹着的——对相关性的悲伤,对生活的悲伤,对我所知道的事物的悲伤——并不是 AI 时代独有的。我认为这是一个标准的事情,随着职业生涯或生命的结束而来。只是可能对我们许多人来说,这种情况会稍微提前一些,同时发生。
我想知道我们是否准备好了。
81.59K
他们的赌注允许正式的数学人工智能系统(如 AlphaProof)。在 2022 年,几乎没有人认为到 2025 年,一个 LLM 能够达到 IMO 金牌水平。

Nat McAleese7月19日 17:47
我们看到的人工智能进展比**保罗·克里斯蒂亚诺**和**尤德科夫斯基**预测的要快得多,他们分别在2025年预测的黄金标准为8%和16%,而且这些方法比预期的更为通用。
164.31K
Sheryl (@sherylhsu02) 是我们多代理团队的第一位成员。加入几个月后,她帮助实现了这一目标。我们很幸运能有她在团队中!

Sheryl Hsu7月19日 15:52
看到模型解决这些国际数学奥林匹克问题并取得金牌级表现,真是太神奇了。几点想法 🧵
114.33K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可