Yann LeCun memperkenalkan VL-JEPA: alternatif non-generatif efisiensi tinggi untuk LLM multimoda yang mengungguli model tradisional baik dalam kecepatan maupun akurasi. * Non-Generatif & Real-Time: Model pertama dari jenisnya dibangun di atas arsitektur prediktif penyematan bersama, memungkinkan tugas bahasa visi domain umum secara real-time. * Performa Unggul: Dengan memprediksi dalam ruang laten daripada token ruang data, secara konsisten mengungguli VLM generatif dalam eksperimen terkontrol. * Efisiensi Streaming: Desainnya yang non-regresif memungkinkan decoding selektif, menawarkan peningkatan efisiensi besar untuk aplikasi video online. * Arsitektur Terpadu: Model tunggal yang secara bersamaan menguasai tugas klasifikasi, pengambilan, dan VQA.