Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
We introduceren WorldVQA, een nieuwe benchmark om atomische visie-gecentreerde wereldkennis te meten in Multimodale Grote Taalmodellen.
Huidige evaluaties verwarren vaak visuele kennisretrieval met redeneren. In tegenstelling tot dat, ontkoppelt WorldVQA deze capaciteiten om strikt te meten "wat het model heeft gememoriseerd."
De benchmark bestaat uit 3.500 VQA-paren verspreid over 9 categorieën, met zorgvuldige aandacht voor linguïstische en culturele diversiteit:

Boven
Positie
Favorieten
