brak wstępnie wytrenowanego enkodera, brak skomplikowanych sztuczek. LeWorldModel pokazuje, jak modele świata oparte na JEPA mogą być trenowane end-to-end z surowych pikseli przy użyciu tylko 2 funkcji straty ~15M parametrów, pojedynczy GPU i ~48× szybsze planowanie niż modele świata oparte na modelach podstawowych.