Aujourd'hui, nous lançons la génération 4D, propulsée par notre modèle de fondation Cube. Les créateurs peuvent construire des expériences qui permettent aux joueurs de créer des objets 3D interactifs comme des voitures, des avions, et plus encore. Ce n'est que le début, découvrez ce qui vient ensuite avec la création alimentée par l'IA. 1/4
Dans notre laboratoire de recherche, nous construisons le "rêve en temps réel" - la capacité de générer des mondes vidéo entièrement jouables à partir de n'importe quel texte ou image. Notre modèle de monde conditionné par l'action en temps réel (actuellement en fonctionnement interne à 16fps à 832x480p) est entraîné sur une combinaison de données, y compris des données d'interaction 3D d'avatar/mondial Roblox propriétaires. Les modèles de monde sont différents des moteurs multijoueurs en ce sens qu'ils stockent l'état et la mémoire dans des latents vidéo. Roblox est multijoueur, et nous recherchons activement des moyens optimaux pour stocker simultanément l'état de milliers de joueurs et les maintenir synchronisés avec leur environnement. Notre modèle de monde tire parti de la technologie de base de données qui stocke toutes les interactions des utilisateurs sur Roblox dans un format vectoriel pouvant être utilisé pour re-rendre la vidéo et l'interaction sous n'importe quel angle de caméra. Nous voyons plusieurs utilisations immédiates pour notre modèle de monde Roblox. Nous l'utiliserons côte à côte avec des invites de texte, d'image et de vidéo comme moyen de lancer l'auto-génération de mondes immersifs. Dans Roblox Studio, un créateur pourrait se déplacer et utiliser des invites pour "peindre" un monde, puis le convertir en une représentation 3D ou directement en natif Roblox comme moyen pour de nombreuses personnes de jouer simultanément. Tout cela prend vie alors que nous explorons la notion de "Théâtre des Rêves" - où un utilisateur rêve, tandis que d'autres le regardent et lui donnent des instructions.
Pour soutenir des mondes massifs et de haute fidélité, notre moteur met en œuvre une stratégie LOD efficace avec un système de transcodage dans le cloud qui diffuse des maillages et des textures, même sur des appareils mobiles moins puissants. Nous étendons ce cadre à l'upsampling AI des mondes 3D à partir de prompts. Dans cette vidéo de prévisualisation ci-dessous, avec un seul prompt utilisateur, notre technologie d'upsampling 3D met à jour la géométrie et la texture pour transformer le jeu classique Roblox Crossroads en un monde fantastique avec des détails organiques riches. 3/4
Nous avons 13 milliards d'heures d'interaction des joueurs sur la plateforme chaque mois. Ces données nous permettent de former des PNJ intelligents capables de raisonner et d'interagir dans des mondes 3D. Notre formation va au-delà des vidéos de gameplay et des simples actions WASD, en utilisant notre modèle de données complet pour une représentation plus détaillée des interactions humaines. Notre vidéo ci-dessous montre des PNJ de Roblox découvrant comment construire un feu de camp en raisonnant à l'envers pour trouver une hache, abattre un arbre et apporter le bois au foyer. C'est encore une recherche précoce, mais nous imaginons un avenir où des PNJ intelligents pourraient jouer aux côtés de vrais joueurs. 4/4
125