分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

🚨GROK 4は60.6%でARC-AGIベンチマークを打ち破りますほとんどのAIを困惑させる推論テストは、ちょうどその一致を満たしました。 Grok 4はARC-AGIで60.6%を記録し、OpenAIの最高は41.0%で、それ以外は一桁台となりました。タスクあたりのコストは?たったの18ドル。クロードは、悪い結果を得るために107ドルが必要です。このベンチマークは、抽象的な推論、つまり人間が見たことのないパズルを解くために使用する種類の推論をテストします。 Grokは、考え方が違うことを証明しただけです。ソース: @xai @elonmusk

62.6K

トップ

ランキング

お気に入り

Trending onchain

Trending on X

Recent top fundings

Most notable