Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
NVIDIA-Direktor für Robotik und angesehener Wissenschaftler. Co-Leiter des GEAR-Labors. Physikalische AGI lösen, ein Motor nach dem anderen. Stanford Ph.D. Der 1. Praktikant von OpenAI.
Beachtet meine Worte: Jedes Jahr von jetzt an wird das Jahr der Robotik sein. Wenn opus 4.5/nanobanana euch umgehauen hat - nun, ihr habt im Welt der Atome noch nichts gesehen. Genießt den LLM-Zug, solange er fährt. Ich steige in das nächste Raumschiff 🚀
Frohes neues Jahr euch allen 🎊
(entschuldigt, ich konnte der ältesten Slop-Figur in der KI nicht widerstehen)

151
Alle sind verrückt nach Vibe-Coding. In der Urlaubsstimmung möchte ich meine Ängste über den Wilden Westen der Robotik teilen. 3 Lektionen, die ich 2025 gelernt habe.
1. Hardware ist der Software voraus, aber die Zuverlässigkeit der Hardware schränkt die Iterationsgeschwindigkeit der Software erheblich ein.
Wir haben exquisite Ingenieurskunst gesehen wie Optimus, e-Atlas, Figure, Neo, G1 usw. Unsere beste KI hat nicht alles aus dieser Grenz-Hardware herausgeholt. Der Körper ist fähiger als das, was das Gehirn befehlen kann. Doch die Betreuung dieser Roboter erfordert ein ganzes Operationsteam. Im Gegensatz zu Menschen heilen Roboter nicht von Prellungen. Überhitzung, defekte Motoren, bizarre Firmware-Probleme verfolgen uns täglich. Fehler sind unwiderruflich und gnadenlos.
Meine Geduld war das einzige, was sich vergrößerte.
2. Benchmarking ist immer noch eine epische Katastrophe in der Robotik.
LLM-Normies dachten, MMLU & SWE-Bench seien gesunder Menschenverstand. Halte dein 🍺 für die Robotik zurück. Niemand ist sich über irgendetwas einig: Hardware-Plattform, Aufgabenbeschreibung, Bewertungsrichtlinien, Simulator oder reale Setups. Jeder ist definitionsgemäß SOTA, basierend auf dem Benchmark, den er spontan für jede Nachrichtenankündigung definiert. Jeder wählt das schönste Demo aus 100 Versuchen aus.
Wir müssen als Fachgebiet 2026 besser werden und aufhören, Reproduzierbarkeit und wissenschaftliche Disziplin als Bürger zweiter Klasse zu behandeln.
3. VLM-basiertes VLA fühlt sich falsch an.
VLA steht für "Vision-Language-Action"-Modell und ist der dominante Ansatz für Robotergehirne. Das Rezept ist einfach: Nimm einen vortrainierten VLM-Checkpoint und füge ein Aktionsmodul oben drauf. Aber wenn man darüber nachdenkt, sind VLMs hyper-optimiert, um Benchmarks wie visuelle Fragenbeantwortung zu erklimmen. Das impliziert zwei Probleme: (1) die meisten Parameter in VLMs sind für Sprache & Wissen, nicht für Physik; (2) visuelle Encoder sind aktiv darauf abgestimmt, niedrigstufige Details *zu verwerfen*, weil Q&A nur ein hohes Verständnis erfordert. Aber minutöse Details sind für Geschicklichkeit sehr wichtig.
Es gibt keinen Grund, warum die Leistung von VLA mit der Skalierung der VLM-Parameter steigen sollte. Das Pretraining ist nicht ausgerichtet. Das Video-Weltmodell scheint ein viel besseres Pretraining-Ziel für die Roboterpolitik zu sein. Ich setze große Hoffnungen darauf.

338
2024: KI ist der Copilot
2025+: Menschen sind der Copilot
Copilot ist die neue Ingenieursfähigkeit. Es ist nicht einfach, den Fahrersitz zu verlassen - wir müssen lernen, auf die KI-Art zu denken und uns an die fremden Arbeitsabläufe anzupassen. Hilf der KI, uns zu helfen.

Andrej Karpathy27. Dez. 2025
Ich habe mich als Programmierer noch nie so hinterher gefühlt. Der Beruf wird dramatisch umgestaltet, da die von den Programmierern beigetragenen Bits zunehmend spärlich und dazwischen sind. Ich habe das Gefühl, dass ich 10X leistungsfähiger sein könnte, wenn ich nur richtig zusammenfüge, was im letzten Jahr verfügbar geworden ist, und ein Versäumnis, den Boost zu nutzen, fühlt sich entschieden wie ein Skill-Problem an. Es gibt eine neue programmierbare Abstraktionsschicht zu meistern (neben den üblichen Schichten darunter), die Agenten, Unteragenten, deren Eingabeaufforderungen, Kontexte, Gedächtnis, Modi, Berechtigungen, Werkzeuge, Plugins, Fähigkeiten, Hooks, MCP, LSP, Slash-Befehle, Workflows, IDE-Integrationen und die Notwendigkeit umfasst, ein allumfassendes mentales Modell für Stärken und Schwächen von grundsätzlich stochastischen, fehleranfälligen, unintelligiblen und sich verändernden Entitäten zu entwickeln, die plötzlich mit dem, was früher gute alte Ingenieurskunst war, vermischt sind. Offensichtlich wurde ein mächtiges, fremdes Werkzeug herumgereicht, aber es kommt ohne Handbuch, und jeder muss herausfinden, wie man es hält und bedient, während das resultierende Erdbeben der Stärke 9 den Beruf erschüttert. Rollt die Ärmel hoch, um nicht hinterherzufallen.
156
Top
Ranking
Favoriten
