🚨GROK 4 打破 ARC-AGI 基准,达到 60.6% 这个让大多数 AI 感到困惑的推理测试终于遇到了对手。 Grok 4 在 ARC-AGI 上达到了 60.6%,而 OpenAI 的最佳成绩为 41.0%,其他所有人都在个位数。 每个任务的成本?仅需 18 美元。 Claude 需要 107 美元才能得到更差的结果。 这个基准测试抽象推理——人类用来解决他们从未见过的难题的那种推理。 Grok 刚刚证明了它的思维方式不同。 来源:@xai @elonmusk
Mario Nawfal
Mario Nawfal7月10日 12:46
🚨XAI 发布了带有英国口音的 "EVE" 语音模型,能够低声细语和唱歌 认识一下 Eve:xAI 对于让 AI 对话变得愉快的回答。 配有优雅的英国口音,因为显然美国的 AI 声音不够复杂。 可以低声说秘密,唱出旋律,并进行听起来不像机器人客服的对话。 来源:@xai @elonmusk
62.59K