HERREGUD, lekkede Gemini 3.0 Pro-benchmarks fra @taker_of_whizz, kan ikke verifisere noe av dette. Benchmarkene er helt utrolige! HLE, 37,5 % MathArena Apex 22,3 % sammenlignet med 1,0 % GPT-5.1 Det er så bra som folk håpet det skulle være!
whizz taker
whizz taker18. nov., 18:57
Gemini 3 Pro-benchmarks
31,1 % ARC AGI 2 HELLIGE MOLY
167,32K