Yann LeCun introduce VL-JEPA: o alternativă de înaltă eficiență, non-generativă, la LLM-urile multimodale, care depășește modelele tradiționale atât în viteză, cât și în acuratețe. * Non-Generativ & Timp Real: Primul model de acest fel construit pe o arhitectură predictivă de încorporare comună, permițând sarcini de viziune în domeniul general în timp real. * Performanță superioară: Prin prezicerea token-urilor în spațiul latent, nu în spațiul de date, depășește constant VLM-urile generative în experimentele controlate. * Eficiența streamingului: Designul său non-autoregresiv permite decodarea selectivă, oferind câștiguri masive de eficiență pentru aplicațiile video online. * Arhitectură unificată: Un singur model care stăpânește simultan sarcinile de clasificare, recuperare și VQA.