Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Stiamo introducendo WorldVQA, un nuovo benchmark per misurare la conoscenza del mondo centrata sulla visione atomica nei Modelli di Linguaggio Multimodali di Grandi Dimensioni.
Le valutazioni attuali spesso confondono il recupero della conoscenza visiva con il ragionamento. Al contrario, WorldVQA disaccoppia queste capacità per misurare rigorosamente "ciò che il modello memorizza."
Il benchmark consiste in 3.500 coppie VQA suddivise in 9 categorie, con particolare attenzione alla diversità linguistica e culturale:

Principali
Ranking
Preferiti
