Yann LeCun introduceert VL-JEPA: een hoog-efficiënte, niet-generatieve alternatieve voor multimodale LLM's die traditionele modellen overtreft in zowel snelheid als nauwkeurigheid. * Niet-Generatief & Real-Time: Het eerste model in zijn soort, gebouwd op een gezamenlijke embedding voorspellende architectuur, die algemene visie-taal taken in real-time mogelijk maakt. * Superieure Prestaties: Door te voorspellen in latente ruimte in plaats van dataruimte tokens, overtreft het consequent generatieve VLM's in gecontroleerde experimenten. * Streaming Efficiëntie: Het niet-autoregressieve ontwerp staat selectieve decodering toe, wat enorme efficiëntiewinsten biedt voor online video-toepassingen. * Geünificeerde Architectuur: Een enkel model dat tegelijkertijd classificatie, retrieval en VQA-taken beheerst.