Skild-AI lägger sina kort på bordet (åtminstone delvis). Teleoperationsdata saknar mångfald och begränsas av en 1:1 mänsklig operatörstidsskala. För att åtgärda detta förtränade Skild sin modell med hjälp av videodata i internetskala (redan allmänt tillgängligt i form av förstapersons "egocentriska" headcam-material till miljontals instruktionsvideor på YouTube).
Genom att utnyttja denna enorma "biologiska intelligens" i mänskliga videor kan modellen utföra en mångfald av uppgifter med mindre än en timmes robotspecifik data.
Detta tillvägagångssätt bryter robotikdataflaskhalsen för att låsa upp grundläggande modellskala. Modellen tål också adversariell interferens – den typ av robusthet som vanligtvis ses vid rörelse.
86