نحن نقدم WorldVQA، وهو معيار جديد لقياس المعرفة العالمية التي تركز على الرؤية الذرية في نماذج اللغات الكبيرة متعددة الوسائط. غالبا ما تخلط التقييمات الحالية بين استرجاع المعرفة البصرية والمنطق. على النقيض من ذلك، تقوم WorldVQA بفصل هذه القدرات لقياس "ما يحفظه النموذج" بدقة. يتكون المعيار من 3,500 زوج من فئة VQA عبر 9 فئات، مع اهتمام دقيق بالتنوع اللغوي والثقافي: