Yann LeCun představuje VL-JEPA: vysoce efektivní, negenerativní alternativu k multimodálním LLM, která překonává tradiční modely jak rychlostí, tak přesností. * Negenerativní a reálný čas: První model svého druhu postavený na společné prediktivní architektuře s embeddingem, umožňující úlohy v obecném jazyce vision v reálném čase. * Vynikající výkon: Díky predikci v latentním prostoru místo tokenů v datovém prostoru konzistentně překonává generativní VLM v kontrolovaných experimentech. * Efektivita streamování: Jeho neautoregresní design umožňuje selektivní dekódování, což přináší obrovské zvýšení efektivity pro online video aplikace. * Unified Architecture: Jeden model, který současně zvládá klasifikaci, vyhledávání a VQA úkoly.