Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Gemini 3 Pro tok nettopp #1-plassen i vår nye AA-Omniscience Index — men det er en nyansert historie
AA-Allvitenhet er vår nye kunnskaps- og hallusinasjonsvurdering. Gemini 3 Pros lederskap drives av høy nøyaktighet (prosentvis korrekt); modellen scoret hele 14 poeng høyere enn den neste modellen med høyest nøyaktighet, Grok 4. Gemini 3 Pros hallusinasjonsrate i evalueringen er 88 %, det samme som Gemini 2.5 Pro og Gemini 2.5 Flash. Dette tyder på at Gemini 3 Pro har gjort betydelige kunnskapsgevinster, men ikke som materielle gevinster i sin tendens til å hallusinere.
Vi måler hallusinasjonsrate basert på hvor ofte modellen svarer feil når den burde ha nektet, definert som andelen feil svar av alle ikke-riktige forsøk. I AA-Omniscience fant vi at det var liten korrelasjon mellom nøyaktighet og hallusinasjonsrate.
I tillegg fant vi en høy korrelasjon mellom størrelsen på åpne vektmodeller og nøyaktighet (men ikke hallusinasjonsrate). Dermed antyder Gemini 3 Pros svært høye nøyaktighet at det er en veldig stor modell.
Se nedenfor for flere detaljer om AA-Omniscience 👇

Topp
Rangering
Favoritter

