Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Lebensupdate: Ich habe beschlossen, 1X zu verlassen.
Es war mir eine Ehre, das Unternehmen mit aufzubauen. Ich trat 2022 (unter dem vorherigen Namen des Unternehmens) Halodi Robotics als der einzige Mitarbeiter aus Kalifornien bei. Zu diesem Zeitpunkt waren wir etwa 40 Mitarbeiter aus Norwegen und 2 in Texas. Mein erster Mitarbeiter und ich arbeiteten einige Monate lang aus meiner Garage, um Geld zu sparen. Heute ist 1X Hunderte von Menschen, mit Hardware, Design, Software, KI, Fertigung und Produkt, die alle in die SF Bay Area verlegt wurden, und wir arbeiten mit voller Kraft daran, NEO für das Zuhause bereit zu machen. Ein großes Dankeschön an all meine Kollegen, mit denen ich gearbeitet habe.
Es war eine schwierige Entscheidung zu gehen. Wenn man in einem aufregenden Startup arbeitet, das schnell wächst, gibt es immer so viel zu tun und nie den perfekten Zeitpunkt, um weiterzuziehen. Wir haben mehrere Projekte in der Pipeline, die so aufregend sind, weil sie die allgemeine Autonomie und Skalierbarkeit unseres Bereitstellungsansatzes erheblich vorantreiben und wirklich einen realistischen Weg aufzeigen, wie das Produkt funktionieren kann. Das kürzliche Update zur Autonomie des World Model ist ein Beispiel, und es kommen noch mehr. Die 1X-Fabrik ist so aufregend. Die Dinge beschleunigen sich mit einer Geschwindigkeit, die mich vor ein paar Jahren überrascht hätte.
Im Jahr 2022 waren die meisten Technologen, Forscher und VCs skeptisch gegenüber Humanoiden und großflächigem Imitationslernen. "Warum Beine?" "Wie könnte End-to-End-Lernen jemals gut genug sein?" "Warum das Zuhause und nicht die Fabrik?" "Wie werden wir jemals genug Daten sammeln?"
Das Overton-Fenster für allgemeine Robotik hat sich seitdem stark verschoben. Obwohl wir noch früh in unserer Mission sind, bin ich zuversichtlich, dass bald Hausroboter so alltäglich sein werden wie Klimaanlagen, Autos und ChatGPT. Man spricht einfach mit dem Bot, und er wird es ruhig erledigen. Ganze Volkswirtschaften werden sich letztendlich um diese Technologie reorganisieren. Die Menschen verstehen es jetzt.
Was kommt als Nächstes?
Ich glaube, dass der Fortschritt im angewandten Deep Learning im Allgemeinen darauf beruht, "die Magie" einiger magischer Objekte zu nutzen. Diese magischen Objekte besitzen viel mehr Verallgemeinerungskraft, als man normalerweise erwarten würde. Nur zu fragen, was man will, ist Magie. Video-Generierungsmodelle sind Magie. Schlussfolgern ist Magie. Man trifft nicht jeden Tag auf ein magisches Objekt, aber wenn man es tut, sorgt man dafür, dass man es ergreift und es nutzt, um etwas Nützliches im Roboter zu schaffen.
Ein großer Teil meines frühen Überzeugung, wohin die Robotik steuerte, kam von der Arbeit an BC-Z von 2018-2021. Das "magische Objekt", auf das ich damals gesetzt habe, waren die überraschenden Datenabsorptionsfähigkeiten des überwachten Lernens und "einfach nach Verallgemeinerung fragen". Dies war der Grundstein für viele der Standardbestandteile, die wir heute in VLAs sehen:
- Verallgemeinerung auf ungesehene Sprachbefehle
- Menschlich geführtes DAgger zur Verbesserung der Politik
- Open-Loop-Hilfsprognosen + rücklaufende Horizontkontrolle, auch bekannt als Aktionschunking
- Manipulationsschlüsselstellen zur Verbesserung des Servos
- Einfaches ResNet18 mit FiLM-Bedingung auf multimodalen Eingaben
Das nächste "magische Objekt", auf das wir bei 1X gesetzt haben, waren Videomodelle, weil sie eindeutig magische Objekte sind, die eine Datenverteilung lernen, die nicht allzu unähnlich ist von dem, was ein Roboter lernen muss. Sie verallgemeinern überraschend gut.
Ich habe erneut das Gefühl, dass es jetzt mehr magische Objekte gibt, was viele neue Möglichkeiten für Robotik und darüber hinaus eröffnet. Ich nehme mir ein paar Monate Zeit, um meine bisherigen Überzeugungen zu leeren und eine frische Perspektive zu gewinnen. Als ich 2022 Google verließ, brauchte ich etwa 2 Wochen, um zu entscheiden, was ich als Nächstes tun wollte. Diesmal möchte ich mir viel mehr Zeit nehmen, um nachzuholen, was im breiteren KI- und Robotikbereich passiert ist.
Ich habe einige Deep-Learning-Papiere neu implementiert. Ich arbeite an einem großen Tutorial für meinen Blog. Ich lerne alle Tricks für Power-User von Claude. Ich lese die Blogbeiträge von Thinking Machines, um zu verstehen, welche Arten von Experimenten in den führenden Laboren durchgeführt werden. Ich lese die Dissertation von Ben Katz aus dem Jahr 2016 über den Mini-Cheetah-Aktor. Ich reise im März nach China, um unglaubliche Unternehmen im chinesischen Robotik-Ökosystem zu treffen. Jetzt, mehr denn je, ist es an der Zeit, dass sowohl Menschen als auch Maschinen lernen. Der nächste Abschnitt meiner Lebenssequenz wird ein wichtiger sein.
An Kollegen und Investoren, die früh auf 1X gesetzt haben, noch bevor wir ein bekannter Name wurden - ich danke Ihnen von ganzem Herzen. Ich werde es nicht vergessen♥️
Top
Ranking
Favoriten
