Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
NVIDIA-Direktor für Robotik und angesehener Wissenschaftler. Co-Leiter des GEAR-Labors. Physikalische AGI lösen, ein Motor nach dem anderen. Stanford Ph.D. Der 1. Praktikant von OpenAI.
Ich beobachte ein Mini-Moraveks-Paradoxon in der Robotik: Gymnastik, die für Menschen schwierig ist, ist für Roboter viel einfacher als "unattraktive" Aufgaben wie Kochen, Putzen und Zusammenbauen. Das führt zu einer kognitiven Dissonanz für Menschen außerhalb des Fachgebiets: "Also, Roboter können Parkour und Breakdance, aber warum können sie sich nicht um meinen Hund kümmern?" Glaub mir, ich wurde von meinen Eltern öfter danach gefragt, als du denkst ...
Das "Robot Moravec's Paradox" erzeugt auch die Illusion, dass die physischen KI-Fähigkeiten viel weiter fortgeschritten sind, als sie tatsächlich sind. Ich mache nicht nur Unitree dafür verantwortlich, da es allgemein auf alle aktuellen akrobatischen Demos in der Branche zutrifft. Hier ist ein einfacher Test: Wenn du eine Wand vor den seitwärts flippen Roboter stellst, wird er mit voller Wucht dagegen knallen und ein Spektakel veranstalten. Denn er passt sich nur dieser einen Referenzbewegung an, ohne sich der Umgebung bewusst zu sein.
Hier ist der Grund, warum das Paradoxon existiert: Es ist viel einfacher, einen "blinden Turner" zu trainieren als einen Roboter, der sieht und manipuliert. Ersteres kann vollständig in Simulation gelöst und null-shot in die reale Welt übertragen werden, während letzteres extrem realistische Renderings, Kontaktphysik und chaotische Dynamik realer Objekte erfordert - nichts davon kann gut simuliert werden.
Stell dir vor, du könntest LLMs nicht aus dem Internet, sondern aus einem rein handgefertigten Text-Console-Spiel trainieren. Die Robotiker hatten Glück. Wir leben in einer Welt, in der beschleunigte Physik-Engines so gut sind, dass wir mit beeindruckenden Akrobatiken auskommen können, ohne echte Daten zu verwenden. Aber wir haben noch nicht denselben Cheat-Code für allgemeine Geschicklichkeit entdeckt.
Bis dahin werden wir weiterhin von unseren verwirrten Eltern befragt.
318,94K
Meine Messlatte für AGI ist viel einfacher: eine KI, die ein schönes Abendessen in jedem Haus für jede Küche zubereitet. Der Physische Turing-Test ist sehr wahrscheinlich schwieriger als der Nobelpreis. Moravecs Paradoxon wird uns weiterhin verfolgen, immer größer und dunkler, im kommenden Jahrzehnt.

Thomas Wolf19. Juli, 16:06
Meine Messlatte für AGI ist eine KI, die einen Nobelpreis für eine neue Theorie gewinnt, die sie selbst entwickelt hat.
99,01K
Ich war in letzter Zeit ein wenig still auf X. Das vergangene Jahr war eine transformative Erfahrung. Grok-4 und Kimi K2 sind großartig, aber die Welt der Robotik ist ein wunderbares Wildwest. Es fühlt sich an wie NLP im Jahr 2018, als GPT-1 veröffentlicht wurde, zusammen mit BERT und tausend anderen Blumen, die blühten. Niemand wusste, welche letztendlich ChatGPT werden würde. Die Debatten waren hitzig. Die Entropie war extrem hoch. Die Ideen waren wahnsinnig spannend.
Ich glaube, das GPT-1 der Robotik ist bereits irgendwo auf Arxiv, aber wir wissen nicht genau, welches. Es könnten Weltmodelle, RL, Lernen aus menschlichen Videos, sim2real, real2sim usw. sein, oder eine beliebige Kombination davon. Die Debatten sind hitzig. Die Entropie ist extrem hoch. Die Ideen sind wahnsinnig spannend, anstatt die letzten paar % bei AIME & GPQA herauszupressen.
Die Natur der Robotik kompliziert auch den Designraum erheblich. Im Gegensatz zur sauberen Welt der Bits für LLMs (Textstrings) müssen wir Robotiker uns mit der chaotischen Welt der Atome auseinandersetzen. Schließlich gibt es ein Stück softwaredefinierten Metalls im Loop. LLM-Normies mögen es schwer finden zu glauben, aber bisher können sich Robotiker immer noch nicht auf einen Benchmark einigen! Verschiedene Roboter haben unterschiedliche Fähigkeitsprofile - einige sind besser in Akrobatik, während andere besser in der Objektmanipulation sind. Einige sind für industrielle Anwendungen gedacht, während andere für Haushaltsaufgaben. Cross-Embodiment ist nicht nur eine Forschungsneuheit, sondern ein wesentliches Merkmal für ein universelles Robotergehirn.
Ich habe mit Dutzenden von Führungskräften aus verschiedenen Roboterunternehmen, alten und neuen, gesprochen. Einige verkaufen den ganzen Körper. Einige verkaufen Körperteile wie geschickte Hände. Viele andere verkaufen die Schaufeln, um neue Körper herzustellen, Simulationen zu erstellen oder massive Datenmengen zu sammeln. Der Geschäftsideenraum ist so wild wie die Forschung selbst. Es ist ein neuer Goldrausch, wie wir ihn seit der ChatGPT-Welle von 2022 nicht mehr gesehen haben.
Die beste Zeit zum Einsteigen ist, wenn der Non-Consensus seinen Höhepunkt erreicht. Wir befinden uns immer noch am Anfang einer Verlustkurve - es gibt starke Lebenszeichen, aber wir sind noch weit, weit von der Konvergenz entfernt. Jeder Gradienten-Schritt führt uns ins Unbekannte. Aber eines weiß ich mit Sicherheit - es gibt keine AGI, ohne den Kontakt, das Fühlen und das Verkörpern in der chaotischen Welt.
Auf einer persönlicheren Note - ein Forschungslabor zu leiten, bringt ein ganz neues Maß an Verantwortung mit sich. Direkte Updates an den CEO eines Unternehmens im Wert von 4 Billionen Dollar zu geben, ist, um es milde auszudrücken, sowohl aufregend als auch allumfassend für mein Aufmerksamkeitsgewicht. Vorbei sind die Zeiten, in denen ich über jede AI-Nachricht auf dem Laufenden bleiben und tief eintauchen konnte.
Ich werde versuchen, mir Zeit zu nehmen, um mehr von meiner Reise zu teilen.

876,93K
Der physische Turing-Test: Ihr Haus ist nach einem sonntäglichen Hackathon ein komplettes Chaos. Am Montagabend kommen Sie nach Hause in ein makelloses Wohnzimmer und ein Candlelight-Dinner. Und man konnte nicht sagen, ob ein Mensch oder eine Maschine dort gewesen war. Täuschend einfach, wahnsinnig schwer.
Es ist der nächste Nordstern der KI. Der Traum, der mich um 12 Uhr im Labor wach hält. Die Vision für die nächste Computing-Plattform, die Chunks von Atomen anstelle von Chunks von Bits automatisiert.
Danke Sequoia, dass du mich bei AI Ascent aufgenommen hast! Im Folgenden finden Sie meinen vollständigen Vortrag über die ersten Prinzipien zur Lösung der Allzweckrobotik: wie wir über die Datenstrategie und die Skalierungsgesetze denken. Ich versichere Ihnen, es werden 17 Minuten sein, die Sie nicht bereuen!
107,2K
Eines Tages im nächsten Jahrzehnt werden wir Roboter in jedem Haus, jedem Krankenhaus und jeder Fabrik haben, die jede langweilige und gefährliche Arbeit mit übermenschlicher Geschicklichkeit erledigen. Dieser Tag wird als "Donnerstag" bekannt sein. Nicht einmal Turing würde es wagen, sich in seinen kühnsten Träumen unser Leben auszumalen.

signüll21. Apr. 2025
Wir haben den Turing-Test bestanden und es war niemandem scheißegal. Keine Paraden. Keine Schlagzeilen auf der Titelseite. gerade... Ein lässiges Achselzucken. Nach dem Motto: "Oh ja, die Maschinen sind schlau genug, um uns jetzt zu täuschen. Wie auch immer, was gibt es zum Mittagessen?"
Diese Stille sagt dir alles über das Tempo, in dem wir uns bewegen.
Damals in meinen CS-Kursen wurde der Turing-Test wie der Endgegner behandelt. Jetzt ist jeder Durchbruch ein weiterer gottverdammter Dienstag.
101,93K
Die humanoiden Olympischen Spiele im Jahr 2030 werden ein wahres Spektakel sein.

Jim Fan5. Feb. 2025
Wir haben humanoide Roboter mit Cristiano Ronaldo, LeBron James und Kobe Bryant trainiert! Dies sind neuronale Netze, die auf echter Hardware in unserem GEAR-Labor laufen. Die meisten Roboter-Demos, die Sie online sehen, beschleunigen die Videos. Wir *verlangsamen sie tatsächlich*, damit Sie die flüssigen Bewegungen genießen können.
Ich freue mich, "ASAP" anzukündigen, ein "real2sim2real"-Modell, das extrem flüssige und dynamische Bewegungen für die ganzheitliche Steuerung humanoider Körper beherrscht.
Wir trainieren den Roboter zuerst in der Simulation, aber es gibt eine notorische "sim2real"-Lücke: Es ist sehr schwierig, dass handgefertigte physikalische Gleichungen mit den Dynamiken der realen Welt übereinstimmen.
Unsere Lösung ist einfach: Setzen Sie eine vortrainierte Strategie auf echter Hardware ein, sammeln Sie Daten und spielen Sie die Bewegung in der Simulation ab. Die Wiedergabe wird offensichtlich viele Fehler aufweisen, aber das gibt ein reichhaltiges Signal, um die physikalische Diskrepanz auszugleichen. Verwenden Sie ein weiteres neuronales Netz, um das Delta zu lernen. Im Grunde "reparieren" wir eine traditionelle Physik-Engine, damit der Roboter die reale Welt im großen Maßstab auf GPUs erleben kann.
Die Zukunft ist hybride Simulation: Kombinieren Sie die Leistung klassischer Simulations-Engines, die über Jahrzehnte verfeinert wurden, mit der unheimlichen Fähigkeit moderner neuronaler Netze, eine chaotische Welt zu erfassen.
45,81K
Wir haben humanoide Roboter mit Cristiano Ronaldo, LeBron James und Kobe Bryant trainiert! Dies sind neuronale Netze, die auf echter Hardware in unserem GEAR-Labor laufen. Die meisten Roboter-Demos, die Sie online sehen, beschleunigen die Videos. Wir *verlangsamen sie tatsächlich*, damit Sie die flüssigen Bewegungen genießen können.
Ich freue mich, "ASAP" anzukündigen, ein "real2sim2real"-Modell, das extrem flüssige und dynamische Bewegungen für die ganzheitliche Steuerung humanoider Körper beherrscht.
Wir trainieren den Roboter zuerst in der Simulation, aber es gibt eine notorische "sim2real"-Lücke: Es ist sehr schwierig, dass handgefertigte physikalische Gleichungen mit den Dynamiken der realen Welt übereinstimmen.
Unsere Lösung ist einfach: Setzen Sie eine vortrainierte Strategie auf echter Hardware ein, sammeln Sie Daten und spielen Sie die Bewegung in der Simulation ab. Die Wiedergabe wird offensichtlich viele Fehler aufweisen, aber das gibt ein reichhaltiges Signal, um die physikalische Diskrepanz auszugleichen. Verwenden Sie ein weiteres neuronales Netz, um das Delta zu lernen. Im Grunde "reparieren" wir eine traditionelle Physik-Engine, damit der Roboter die reale Welt im großen Maßstab auf GPUs erleben kann.
Die Zukunft ist hybride Simulation: Kombinieren Sie die Leistung klassischer Simulations-Engines, die über Jahrzehnte verfeinert wurden, mit der unheimlichen Fähigkeit moderner neuronaler Netze, eine chaotische Welt zu erfassen.
543,12K
Dass ein *zweites* Papier mit einer Menge an RL-Flywheel-Geheimnissen und *multimodaler* o1-artiger Argumentation veröffentlicht wurde, steht heute nicht auf meiner Bingo-Karte. Die Papiere von Kimi (einem anderen Startup) und DeepSeek haben bemerkenswerterweise ähnliche Ergebnisse erzielt:
> Keine Notwendigkeit für komplexe Baumsuchen wie MCTS. Einfach die Gedankenverfolgung linearisieren und gute alte autoregressive Vorhersage machen;
> Keine Notwendigkeit für Wertfunktionen, die eine weitere teure Kopie des Modells erfordern;
> Keine Notwendigkeit für dichte Belohnungsmodellierung. So viel wie möglich auf Groundtruth, Endergebnis verlassen.
Unterschiede:
> DeepSeek verfolgt den AlphaZero-Ansatz - rein bootstrap durch RL ohne menschlichen Input, d.h. "kalter Start". Kimi verfolgt den AlphaGo-Master-Ansatz: leichtes SFT, um durch prompt-engineered CoT-Spuren aufzuwärmen.
> DeepSeek-Gewichte sind MIT-Lizenz (Thought Leadership!); Kimi hat noch keine Modellveröffentlichung.
> Kimi zeigt starke multimodale Leistung (!) bei Benchmarks wie MathVista, die visuelles Verständnis von Geometrie, IQ-Tests usw. erfordern.
> Das Kimi-Papier enthält VIEL mehr Details zum Systemdesign: RL-Infrastruktur, hybrider Cluster, Code-Sandbox, Parallelitätsstrategien; und Lern-Details: langer Kontext, CoT-Kompression, Lehrplan, Sampling-Strategie, Testfall-Generierung usw.
Optimistische Lektüre an einem Feiertag!

300,42K
Top
Ranking
Favoriten
Onchain-Trends
Im Trend auf X
Aktuelle Top-Finanzierungen
Am bemerkenswertesten