🚨GROK 4は60.6%でARC-AGIベンチマークを打ち破ります ほとんどのAIを困惑させる推論テストは、ちょうどその一致を満たしました。 Grok 4はARC-AGIで60.6%を記録し、OpenAIの最高は41.0%で、それ以外は一桁台となりました。 タスクあたりのコストは?たったの18ドル。 クロードは、悪い結果を得るために107ドルが必要です。 このベンチマークは、抽象的な推論、つまり人間が見たことのないパズルを解くために使用する種類の推論をテストします。 Grokは、考え方が違うことを証明しただけです。 ソース: @xai @elonmusk
Mario Nawfal
Mario Nawfal7月10日 12:46
🚨XAIがささやき声で歌うイギリス訛りの「EVE」ボイスモデルをドロップ イブの紹介:AIの会話を実際に快適にするためのxAIの答え。 上品なイギリス訛りがついているのは、どうやらアメリカのAIの声が十分に洗練されていなかったからだ。 秘密をささやき、曲を口ずさみ、ロボットのカスタマーサービスとは思えない会話をすることができます。 ソース: @xai @elonmusk
62.6K