🚨GROK 4 打破 ARC-AGI 基準,達到 60.6% 這項讓大多數 AI 感到困惑的推理測試終於遇到了對手。 Grok 4 在 ARC-AGI 上達到了 60.6%,而 OpenAI 的最佳成績僅為 41.0%,其他人則在單位數之內。 每個任務的成本?僅需 18 美元。 Claude 需要 107 美元才能得到更差的結果。 這個基準測試抽象推理——人類用來解決他們從未見過的謎題的那種推理。 Grok 剛剛證明了它的思維方式不同。 來源:@xai @elonmusk
Mario Nawfal
Mario Nawfal7月10日 12:46
🚨XAI 發布了帶有英國口音的 "EVE" 語音模型,能低語和唱歌 認識一下 Eve:xAI 對於讓 AI 對話變得愉快的解答。 擁有優雅的英國口音,因為顯然美國的 AI 聲音不夠高雅。 能低語秘密、唱出旋律,並進行不聽起來像機器人客服的對話。 來源:@xai @elonmusk
62.55K