🚨 AutoBench 1.0 – Run 4が稼働📷中 - 33のフロンティアモデルランキング(GPT-5.1、Gemini 3 Pro、Grok 4.1、Kimi K2 Thinkingなどを含む) - 21 ランキングモデル - 300+新規問題生成 - 220,000+個人ランキング これまでで最も操作に強い評価だ。 そして、そうです...勝者は多くの人が予想していた人物とは全く違う。 1/13