Door tekstwebsites te gebruiken om een tekstmodel te leren en door video's te gebruiken om een wereldmodel te leren, is dit misschien de meest haalbare weg. Omdat video's in wezen vertegenwoordigen wat de ogen zien, heeft de mens de wereldmodel opgebouwd door middel van de ogen.