静的ベンチマークは非常に重要であり、@grok 4のパフォーマンスは間違いなく印象的です。 私はまだ、モデルが彼らの手に渡ったときに人々がモデルについてどう思うかを見るのを待っています。期待に応えられるか? 結局のところ、それは個々のユーザーにとっての真の有用性についてです。 Grok 4 は、@lmarena_ai の何百万人ものユーザーの手に渡っています。彼らが最初のステップとして何を考えているのか、楽しみでなりません! 私の側では、いくつかの難しい数学の問題を尋ねてみましたが、@grokうまくいったようです。簡潔で事実に基づいたものです。とても賢いようで、このモデルで研究について話し合うのが好きです。 交換性に関する証明は添付画像でチェック!バグがないようです...
8.65K