热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
AI 拥有博士学位,现在正在求职市场上。
介绍 AI 生产力指数 (APEX),这是一个衡量我们在全球最有价值行业中自动化程度的基准。
大多数基准研究抽象能力。APEX 评估模型在法律、金融、咨询和医学等领域的实际交付能力。
根据 APEX,目前最能胜任工作的模型:
🥇 GPT 5
🥈 Grok 4
🥉 Gemini 2.5 Flash
其他发现:
- GPT 5 在所有 4 个领域表现最强
- 一些便宜的模型在同一提供商中超越了更昂贵的模型(例如,Gemini 2.5 Flash vs. Gemini 2.5 Pro)
- 最好的开源模型 Qwen(第 7 位)整体表现仅比 Grok 4 落后 2%
热门
排行
收藏

