热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
就在两天前,我还以为人类是安全的,真的是以天为单位在倒计时……
一些背景:这并不是人工智能第一次在国际数学奥林匹克(IMO)中获奖。去年,谷歌的AlphaProof获得了银牌——但那个模型是专门为数学训练的。
这一次,OpenAI使用了一个通用模型(可能是内部的GPT-5原型?),并且赢得了金牌。这是一个巨大的飞跃。
为了让大家更好地理解:解决一个IMO级别的问题通常需要顶尖人类选手大约100分钟。就在两年前,顶尖的人工智能模型仍在努力解决小学水平的文字问题(GSM8k),人类大约需要10秒钟就能解决。
正如OpenAI的Dan Roberts在红杉资本的AI Ascent 2025上分享的那样,人工智能能够处理的任务长度每7个月就会翻一番。到2025年底,GPT-5很可能会在小时级人类任务水平上运作。
一个警告:据报道,今年的IMO在难度平衡上存在缺陷——问题1到5相对简单,而问题6则异常困难。因此,许多分数集中在28到35之间(每个问题值7分)。人工智能得分为35——刚好够得金牌。这有点运气成分,但这个轨迹是不可否认的。
最后,数学竞赛无疑将成为中国的中国人、美国的中国人和人工智能模型(由在美国和中国的中国人构建)之间的竞赛。

7月19日 15:50
1/N 我很高兴地分享,我们最新的 @OpenAI 实验性推理 LLM 在人工智能领域实现了一个长期以来的重大挑战:在世界上最负盛名的数学竞赛——国际数学奥林匹克(IMO)中达到了金牌级别的表现。

6.63K
热门
排行
收藏