跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
探索 Web3 Giveaway 活动,每周丰厚奖励等您来领取
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+4.56%
USELESS
+15.86%
IKUN
+11.48%
gib
-6.7%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+7.67%
ALON
-1.14%
LAUNCHCOIN
+12.58%
GOONC
+6.14%
KLED
-17.59%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+1.31%
Boopa
+14.33%
PORK
0.00%
主页
Jakub Pachocki
开放人工智能
查看原文
Jakub Pachocki
9月18日 02:15
转发 @markchen90: 对齐无疑是最重要的 AI 研究前沿。 随着我们扩展推理,模型获得了情境意识 a…
53
Jakub Pachocki
9月18日 01:17
上周,我们的推理模型参加了2025年国际大学生程序设计竞赛(ICPC),这是全球顶尖的大学级编程比赛。我们的系统解决了12个问题中的全部12个,这一表现将我们置于全球第一(最佳人类团队解决了11个问题)。 这一里程碑标志着我们模型在过去两个月中激烈竞争表现的结束: - 在AtCoder启发式世界决赛中获得第二名 - 在国际数学奥林匹克中获得金牌 - 在国际信息学奥林匹克中获得金牌 - 现在,在ICPC世界决赛中获得金牌,取得第一名。 我相信,这些结果来自于我们主要研究项目中的一系列通用推理模型,或许是今年进展的最清晰基准。这些比赛是发现新想法的绝佳自我封闭、时间限制测试。即使在我们的模型熟练掌握简单算术之前,我们就将这些比赛视为朝向变革性人工智能进展的里程碑。 当面临明确的问题并限制在约5小时内时,我们的模型现在在这些领域中排名接近顶尖人类。现在的挑战是转向更开放的问题,以及更长的时间范围。这种推理能力的水平,应用于真正重要的问题上,持续数月甚至数年,正是我们所追求的——自动化科学发现。 这一快速进展也强调了安全与对齐研究的重要性。我们仍然需要更多了解长期运行推理模型的对齐特性;特别是,我建议回顾我们今天发布的关于推理模型中策划行为的研究中令人着迷的发现。 祝贺我的队友们,他们倾注了心血以取得这些比赛结果,也祝贺所有为支持这些成果的基础研究做出贡献的人!
Mostafa Rohaninejad
9月18日 01:06
1/n 我非常兴奋地分享,我们的 @OpenAI 推理系统在 2025 年 ICPC 世界总决赛中获得了 12/12 的完美分数,这是全球顶尖大学团队解决复杂算法问题的顶级大学编程比赛。这将使它在所有人类参与者中名列第一。 🥇🥇
151
Jakub Pachocki
2025年7月16日
我对思维链的潜力、忠实性和可解释性感到非常兴奋。它极大地影响了我们推理模型的设计,从 o1-preview 开始。 随着人工智能系统花费更多的计算来处理长期研究问题,我们必须有某种方法来监控它们的内部过程。隐藏 CoT 的奇妙特性在于,虽然它们以我们可以解释的语言为基础,但可扩展的优化过程并不不利于观察者验证模型意图的能力——这与奖励模型的直接监督不同。 这里的紧张关系在于,如果默认情况下没有隐藏 CoT,并且我们将该过程视为 AI 输出的一部分,那么就有很大的动力(在某些情况下,有必要)对其进行监督。我相信我们可以在这里努力实现两全其美——训练我们的模型,使其能够很好地解释其内部推理,但同时仍然保留偶尔验证它的能力。 CoT 忠实度是更广泛的研究方向的一部分,即可解释性培训:以一种至少训练系统的一部分保持诚实和可监控的方式设定目标。我们将继续增加对 OpenAI 这项研究的投资。
Bowen Baker
2025年7月16日
现代推理模型用简单的英语思考。 监控他们的想法可能是监督未来人工智能系统的强大但脆弱的工具。 我和许多组织的研究人员认为,我们应该努力评估、保存甚至改进 CoT 可监测性。
335
热门
排行
收藏