跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-8.39%
USELESS
-15.16%
IKUN
-9.75%
gib
-3.91%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-6.3%
ALON
-7.3%
LAUNCHCOIN
+4.19%
GOONC
-5.97%
KLED
+5.64%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.04%
Boopa
-3.52%
PORK
0.00%
主页
steve hsu
物理学家、AI 创始人、Manifold 播客
查看原文
steve hsu
13 分钟前
我采用了类似的生成器-验证器方法来使用模型进行理论物理研究。 处于科学前沿的人类专家可以改进验证器模型,使其在现实世界研究问题上(不仅仅是人为设计的数学竞赛问题 = 可以在有限时间内由人类解决的良好问题)实现极强的自主操作能力。 DeepSeekMathV2 生成器与验证器之间的协同作用 证明生成器和验证器形成了一个自我改进的反馈循环。随着生成器产生越来越复杂的证明,这些证明挑战验证器,暴露出弱点,成为新的训练数据。最初,人类专家通过审查验证器标记的问题来指导验证器的再训练——这一过程通过为每个证明生成多个验证尝试而变得高效。这种“元验证”(检查验证器的发现而不是直接检查证明)对人类来说更容易,对大型语言模型(LLMs)来说也更易于学习。 通过扩大验证器分析的数量并在这些AI辅助的注释上进行训练,验证器最终达到了一个可靠性水平,在最终运行中不再需要人类干预——完成了自动证明生成与验证之间的闭环。
393
steve hsu
14 小时前
Suno 是非常优秀的 AI
2.82K
31
steve hsu
23 小时前
华为最新手机中的麒麟9030。 ~5nm级工艺 = 中芯国际 + 华为合作 关于使用AI来改善DUV多图案化的传闻
2.64K
32
热门
排行
收藏