DApp Store | Web3 Hub for hendelser og spill

Populære emner

Gemini 3 Pro tok nettopp #1-plassen i vår nye AA-Omniscience Index — men det er en nyansert historie AA-Allvitenhet er vår nye kunnskaps- og hallusinasjonsvurdering. Gemini 3 Pros lederskap drives av høy nøyaktighet (prosentvis korrekt); modellen scoret hele 14 poeng høyere enn den neste modellen med høyest nøyaktighet, Grok 4. Gemini 3 Pros hallusinasjonsrate i evalueringen er 88 %, det samme som Gemini 2.5 Pro og Gemini 2.5 Flash. Dette tyder på at Gemini 3 Pro har gjort betydelige kunnskapsgevinster, men ikke som materielle gevinster i sin tendens til å hallusinere. Vi måler hallusinasjonsrate basert på hvor ofte modellen svarer feil når den burde ha nektet, definert som andelen feil svar av alle ikke-riktige forsøk. I AA-Omniscience fant vi at det var liten korrelasjon mellom nøyaktighet og hallusinasjonsrate. I tillegg fant vi en høy korrelasjon mellom størrelsen på åpne vektmodeller og nøyaktighet (men ikke hallusinasjonsrate). Dermed antyder Gemini 3 Pros svært høye nøyaktighet at det er en veldig stor modell. Se nedenfor for flere detaljer om AA-Omniscience 👇

Topp

Rangering

Favoritter