DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Stiamo introducendo WorldVQA, un nuovo benchmark per misurare la conoscenza del mondo centrata sulla visione atomica nei Modelli di Linguaggio Multimodali di Grandi Dimensioni. Le valutazioni attuali spesso confondono il recupero della conoscenza visiva con il ragionamento. Al contrario, WorldVQA disaccoppia queste capacità per misurare rigorosamente "ciò che il modello memorizza." Il benchmark consiste in 3.500 coppie VQA suddivise in 9 categorie, con particolare attenzione alla diversità linguistica e culturale:

Principali

Ranking

Preferiti