跳转至主要内容
行情
热门代币
探索热门代币排名,掌握最新市场动态
扫链
跟踪由 Pump.Fun 等平台推出的最新热门 Meme 币
牛人榜
排行、跟踪并分析热门交易地址
信号
获取实时信号,解锁市场洞察
追踪
追踪你最喜欢的代币和钱包地址
DEX
币币兑换
交易聚合器,多路径选择,自由换币
专业交易
深度数据分析,进阶交易设置,为链上玩家打造
DeFi
市场
发现
洞察中心
Web3 世界全知道
Cryptoverse
探索不同网络的 DApp,赢取各种奖励
交易竞技场
Cryptopedia
Giveaway
奖励中心
Eco Hub
探索公链生态,链接无限未来
开发者中心
DEX API
通往链上流动性的入口
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
搜索地址、交易、区块、代币或 ENS
X Layer
一起探索和建设 X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
App、网页端插件、Mini 钱包
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
行情
热门代币
扫链
牛人榜
信号
追踪
DEX
币币兑换
专业交易
DeFi
市场
发现
洞察中心
Cryptoverse
Eco Hub
开发者中心
DEX API
区块链浏览器
X Layer
DApp 连接钱包
语言
货币
下载 OKX Wallet
Web3 指南
洞察中心
Cryptoverse
交易竞技场
Cryptopedia
Giveaway
Eco hub
探索 Web3 Giveaway 活动,每周丰厚奖励等您来领取
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+1.45%
USELESS
-4.11%
IKUN
-3.94%
gib
+12.22%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-9.8%
ALON
-11.35%
LAUNCHCOIN
-17.41%
GOONC
-18.27%
KLED
-16.44%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-2.65%
Boopa
-4%
PORK
-10.17%
主页
will brown
奖励黑客@primeintellect
更多
查看原文
will brown
15 小时前
我在 Prime Intellect 工作时最喜欢的部分之一就是每当有人启动一个新的实例时,可以选择一些搞笑的名字。
更多
3.52K
47
will brown
17 小时前
RL 从完全不工作到工作得如此出色,以至于代码可能存在重大正确性错误,但你却不会注意到,因为它仍然可以正常运行。
更多
21.98K
392
will brown
19 小时前
总有一天我会开始压缩提交,但今天不是那一天。
更多
5.58K
60
will brown
20 小时前
真可惜,我们的互联网流量快用完了,因为大家都停止在互联网上发布新内容。
更多
10.47K
176
will brown
22 小时前
ChatGPT 应该有一个大绿色开关,上面写着 "Syco Mode"
更多
5.15K
66
will brown 已转发
Casper Hansen
7月22日 23:07
将 Qwen3 1.7B 后训练为 DeepResearch 模型的配方 小型模型深度思考意味着什么?认识 Lucy,一个基于 @willccbb 的验证者后训练的 Qwen3-1.7B DeepResearch 模型。 主要基于规则的奖励: - 答案正确性 我们检查最终响应是否字面上包含真实答案。这个子字符串匹配成本低,避免调用更大的 LLM 进行判断。 - 访问/搜索比率 如果代理访问的页面数量至少与其发出的搜索查询数量相同,则它将获得 ((visit_search_ratio - 1) / 4) ** 0.25 的奖励。如果它搜索的次数多于访问的次数,得分为 -0.5。 格式 / 反奖励黑客奖励: - 工具执行成功 每个没有错误返回的 API 调用都算作成功。奖励为 (successful_calls * unique_tools_used) / total_call_attempts。 - 思考效率 一个以 70 个 token 为中心的偏斜正态惩罚,旨在阻止在调用工具之间进行无尽的思考链,同时仍然允许足够的 token 用于规划。 这就是 Qwen3 1.7B 学会搜索、访问和综合信息的方式。小型模型也能进行深度研究!
更多
35.61K
491
will brown
7月22日 22:31
如果一个模型使用多个顺序的工具调用,并交替进行思维链推理来回答一个单一问题,这就是:
查看讨论
12.29K
48
will brown
7月22日 21:39
关于已经在 GitHub 上的事物进行模糊发布的概念
更多
5.78K
93
will brown
7月22日 21:39
只需要再发几件小东西,然后就可以发大东西了 即将到来的时代会非常有趣,真的一切都在逐渐成型,哇
更多
3.67K
43
will brown
7月22日 21:02
过去一年我的生活发生了如此巨大的变化,真是让我感到不可思议。去年夏天,我刚刚完成了计算机科学理论的博士学位,从银行实习生转为全职银行员工,并且刚刚在这里达到了1000个粉丝。昨天在我的航班上,有人认出了我。
查看讨论
54.3K
696
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可
Uniswap
DEX
PumpSwap
DEX
daos.fun
DeFi
4
Beefy Finance
DeFi
5
Pancake Swap
DeFi
DEX
质押
Yield
6
AutoShark Finance
DeFi
7
Blackhole
DEX
8
Obric
DEX
9
KLAYswap
DeFi
DEX
质押
Yield
10
1inch Network
DeFi
DEX
流动性池