跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+8.73%
USELESS
-2.01%
IKUN
-3.53%
gib
-4.62%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-2.91%
ALON
-0.77%
LAUNCHCOIN
-6.81%
GOONC
-1.43%
KLED
-2.04%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.41%
Boopa
-5.92%
PORK
0.00%
主页
马东锡 NLP 🇸🇪
上一篇 博士 @Stockholm_Uni |校友@KTHuniversity @uppsalauni 分享有关 AI、自主代理以及大型语言和推理模型的见解。
查看原文
马东锡 NLP 🇸🇪
12月7日 05:02
「 Measuring Agents in Production 」 2023年,Agent 是我的宗教。 2024年,在学术上,发了 Agent 的 paper,与朋友合作,在工业界场景第一次跑通第一个 Agent。 2025年,所有的公司都在做 Agent,导致我看到 Agent 就感到审美疲劳。 现实世界的应用里,除去 Coding Agent,其他领域的Agent 到底是autonomous Agent,还是只是一个写好的 workflow? 如果有一个明确目的Agent 就是一个种 workflow,那么没有明确目的的 Agent 形态是什么样的,是否有存在意义? 更重要的是,现实世界的 Agent 有没有做完备的评估?它的可靠性和安全性到底如何? 来读这篇, Measuring Agents in Production。
21.39K
257
马东锡 NLP 🇸🇪
2025年11月19日
读了 Gemini 3 的 model card,会发现 Gemini 3 明确不是 Gemini 2.5 的微调,它是全新训练的 sparse MoE 。 也就是说,在 Gemini 2.5 已经非常出色的 RL 后训练和 parallel thinking 基础上,崭新的 backbone 让 Gemini 3 非常出色,总结这半年 Gemini 的工作: 1. 出色的 RL 后训练 2. parallel thinking 3. 崭新的 backbone 4. 一个又一个公开的对行业有益的benchmark,如 IMO-Bench 对比一下这半年 OpenAI 做了什么? 1. 不存在的 GPT-5 2. Adaptive thinking, 主打一个为企业省钱,把用户当sb 2. 被人遗忘的 agent mode 3. proactive assistant,涌动的广告之心 4. credit expiration,紧盯着用户的钱包 5. Sam 永无止境的 Hype 什么是伟大的公司,什么是鸡贼的公司?
74.23K
483
马东锡 NLP 🇸🇪
2025年11月13日
今天在 huggingface 上看到了 VibeThinker-1.5B,来自微博 AI。 这个名字熟悉又陌生。才意识到,拥有巨量数据的微博,在 AI 领域不是掉队的问题,是似乎毫无存在感。
21K
60
热门
排行
收藏