热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Tim Dettmers
在我看来,SWE-bench 和 T-bench 是少数几个在我们模型进展方面有良好信号的基准。这款模型的表现与 Qwen3 Coder 相当,仅比 GPT-5 差 10%,同时它还是一款通用的 LLM,而不是专门针对代码的。

Z.ai8月11日 11:43
呈现 GLM-4.5 技术报告!👇
这项工作展示了我们如何通过独特的多阶段训练范式开发出在推理、编码和代理任务方面表现出色的模型。
关键创新包括通过自我蒸馏进行专家模型迭代以统一能力、用于动态问题解决的混合推理模式,以及基于难度的强化学习课程。

28.51K
Tim Dettmers 已转发
思维的洗礼:与其保留你的Twitter/𝕏收入,不如将其用于你选择的“收入挑战”——任何你希望在世界上更多的东西!
这是我这一轮的挑战,结合我最近的3次收入,总计$5478.51:
人类在人工智能崛起的同时,绝不能倒下。人类必须继续崛起,与之共同进步。创造一些专门旨在提升人类团队的东西。定义故意留得有些模糊,以保持人们对其解释的某种熵,但在我看来,例子包括:
- 任何有助于解释、可视化、记忆、启发、理解、协调等的软件。
- 不必太高大上,例如,它可以是某个特定的教育文章/视频,解释一些其他人可能受益的内容,或者你拥有独特知识的内容。
- 用于解释的提示/代理,例如,类似于最近发布的ChatGPT学习模式。
- 相关的艺术作品
这个挑战将持续2周,直到8月17日太平洋标准时间结束。请将你的贡献作为回复提交。它必须是为这个挑战独特创造的东西,否则不会存在。标准包括执行、杠杆、创新、启发、美学、娱乐。人们可以通过点赞来为提交的作品投票,这个“民意选择”也将是一个因素。我将在8月17日决定获胜者,并发送$5478.51 :)
676.38K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可