なんてこった、@taker_of_whizzから流出したGemini 3.0 Proのベンチマークで、どれも確認できません。 ベンチマークは本当に驚異的です! HLE、37.5% MathArena Apex 22.3%に対し、GPT-5.1は1.0%です 人々が期待していた通りの出来です!
whizz taker
whizz taker11月18日 18:57
ジェミニ3 Proベンチマーク
31.1% ARC AGI 2 ホーリー・モリー
167.33K