Astăzi, lansăm generarea 4D, alimentată de modelul nostru Cube Foundation Model. Creatorii pot crea experiențe care permit jucătorilor să creeze obiecte 3D interactive precum mașini, avioane și altele. Acesta este doar începutul, vedeți ce urmează cu creația alimentată de AI. 1/4
În laboratorul nostru de cercetare, construim "visarea în timp real" – abilitatea de a genera lumi video complet redabile, pornind de la orice text sau imagine. Modelul nostru de lume în timp real, condiționat de acțiune (care rulează intern la 16fps la 832x480p) este antrenat pe o combinație de date, inclusiv date proprietare Roblox 3D de interacțiune avatar/lume. Modelele lumilor diferă de motoarele multiplayer prin faptul că stochează starea și memoria în latente video. Roblox este multiplayer și cercetăm activ modalități optime de a stoca simultan starea pentru mii de jucători și de a-i menține sincronizați cu mediul lor. Modelul nostru mondial folosește tehnologia bazelor de date care stochează toate interacțiunile utilizatorilor pe Roblox într-un format vectorial ce poate fi folosit pentru a re-randa video și interacțiuni din orice unghi de cameră. Vedem mai multe utilizări imediate pentru modelul nostru de lume Roblox. Îl vom folosi alături de text, imagini și videoclipuri ca o modalitate de a lansa generarea automată a lumilor imersive. În Roblox Studio, un creator putea să se plimbe prin zonă și să folosească prompturi pentru a "vopsi" o lume, apoi să o convertească într-o reprezentare 3D sau direct în Roblox nativ, ca o modalitate pentru mulți oameni de a juca simultan. Toate acestea prind viață pe măsură ce explorăm noțiunea de "Teatru al Viselor" – unde un utilizator visează, în timp ce alții îl urmăresc și îl îndemn. 2/4
Pentru a susține lumi masive și de înaltă fidelitate, motorul nostru implementează o strategie LOD eficientă cu un sistem de transcodare cloud care transmite mesh-uri și texturi, chiar și pe dispozitive mobile de nivel inferior. Extindem acest cadru către upsampling AI a lumilor 3D din prompturi. În acest videoclip de previzualizare de mai jos, cu un singur prompt de utilizator, tehnologia noastră de upsampling 3D actualizează geometria și textura pentru a transforma jocul clasic Roblox Crossroads într-o lume fantastică cu detalii organice bogate. 3/4
Avem 13 miliarde de ore de interacțiune cu jucătorii pe platformă lunar. Aceste date ne permit să antrenăm NPC-uri inteligente care pot raționa și interacționa în lumi 3D. Antrenamentul nostru depășește videoclipurile cu gameplay și acțiunile simple WASD, utilizând modelul nostru complet de date pentru o reprezentare mai detaliată a interacțiunilor umane. Videoclipul nostru de mai jos arată NPC-uri Roblox cum să învețe cum să facă un foc de tabără raționând invers pentru a găsi un topor, a tăia un copac și a aduce lemnul la foc. Aceasta este încă o cercetare timpurie, dar ne imaginăm un viitor în care NPC-urile inteligente ar putea juca alături de jucători reali. 4/4
110