kein vortrainierter Encoder, keine komplexen Tricks. LeWorldModel zeigt, wie JEPA-basierte Weltmodelle end-to-end aus Rohpixeln mit nur 2 Verlusttermen trainiert werden können ~15M Parameter, eine einzelne GPU und ~48× schnellere Planung als Foundation-Model-Weltmodelle.