Ein agentisches VLM-Modell zu haben, das Schattierungen und das Rendern deiner 3D-Szene ermöglicht, ist das ultimative Gegenbeispiel für die "Pixel sind alles, was du brauchst"-Fraktion. Echtzeit-Video ist mächtig - es ist sogar ein neues Medium. Aber explizites 3D ist immer noch sehr nützlich. Außerdem macht mich dieser Donut hungrig.