تحديث حياتي: قررت أن أترك 1X. لقد كان شرفا لي أن أساعد في نمو الشركة. انضممت إلى شركة Halodi Robotics في عام 2022 (الاسم السابق للشركة) كموظف وحيد مقيم في كاليفورنيا. في ذلك الوقت، كنا حوالي 40 شخصا مقيمين في النرويج واثنان في تكساس. أول موظف لي وأنا عملنا من مرآبي لبضعة أشهر لتوفير المال. اليوم، 1X يضم مئات الأشخاص، مع الأجهزة والتصميم والبرمجيات الذكاء الاصطناعي والتصنيع والمنتجات، جميعها تم نقلها إلى منطقة خليج سان فرانسيسكو، تعمل بكامل طاقتها وتعمل على تجهيز NEO للمنزل. شكر كبير لجميع زملائي الذين عملت معهم. كان قرارا صعبا أن أغادر. عند العمل في شركة ناشئة مثيرة تنمو بسرعة، هناك دائما الكثير لتفعله ولا يوجد وقت مثالي للمضي قدما. لدينا عدة أعمال قيد التنفيذ مثيرة جدا لأنها تعزز بشكل كبير الاستقلالية العامة وقابلية التوسع في نهج النشر لدينا وتظهر مسارا واقعيا نحو عمل المنتج. تحديث الاستقلالية الأخير لنموذج العالم هو مثال واحد، وهناك المزيد قادم. مصنع 1X مثير جدا. الأمور تتسارع بسرعة كنت سأفاجئها قبل عدة سنوات. في عام 2022، كان معظم التقنيين والباحثين ومستثمري رأس المال الجريء متشككين بشأن الكائنات الشبيهة بالبشر والتعلم التقليدي على نطاق واسع. "لماذا الأرجل؟" "كيف يمكن أن يكون التعلم من البداية إلى النهاية كافيا؟" "لماذا تذهب إلى المنزل وليس المصنع؟" "كيف سنجمع بيانات كافية يوما ما؟" نافذة أوفرتون حول الروبوتات متعددة الأغراض تغيرت كثيرا منذ ذلك الحين. على الرغم من أننا ما زلنا في بداية مهمتنا، إلا أنني واثق من أن روبوتات المنزل ستصبح شائعة مثل مكيفات الهواء والسيارات وChatGPT. فقط تحدث مع الروبوت، وسيذهب وينجز الأمر بهدوء. اقتصادات بأكملها ستعيد تنظيمها في النهاية حول هذه التكنولوجيا. الناس يفهمون الآن. ما التالي؟ أعتقد أن التقدم في التعلم العميق التطبيقي يعتمد عموما على "تسخير السحر" من بعض الأشياء السحرية. هذه الأشياء السحرية تمتلك قدرة تعميم أكبر بكثير مما قد يتوقعه المرء عادة. مجرد طلب من الماجستير لفهم ما تريد هو أمر سحري. نماذج توليد الفيديو سحرية. المنطق سحر. لا تصادف شيئا سحريا كل يوم، لكن عندما تصادف، تأكد من أخذه واستخدامه لصنع شيء مفيد في الروبوت بطريقة ما. الكثير من قناعتي المبكرة حول اتجاه الروبوتات كان من العمل على BC-Z من 2018 إلى 2021. الشيء "السحري" الذي راهنت عليه في ذلك الوقت كان القدرات المفاجئة على امتصاص البيانات للتعلم المراقب و"فقط اطلب التعميم". كان هذا رائدا في العديد من المكونات القياسية التي نراها اليوم في VLAs: - التعميم إلى أوامر اللغة غير المرئية - برنامج التوجيه البشري لتحسين السياسات - التنبؤات المساعدة المفتوحة + التحكم في الأفق المتراجع، المعروف أيضا بتقسيم الفعل - نقاط المفاتيح في التلاعب لتحسين السيرفو - ResNet18 البسيط مع تكييف FiLM على المدخلات متعددة الوسائط الجسم السحري التالي الذي راهننا عليه عند 1X كان نماذج الفيديو، لأنها بوضوح أشياء سحرية تتعلم توزيع بيانات لا يختلف كثيرا عما يحتاجه الروبوت لتعلمه. هم يعممون بشكل مفاجئ. أشعر مرة أخرى أن هناك المزيد من الأشياء السحرية في اللعب الآن، مما يفتح الكثير من الإمكانيات الجديدة للروبوتات وما بعدها. أنا آخذ عدة أشهر لأتخلص من السوابق وأكتسب منظورا جديدا. عندما تركت جوجل في 2022، قضيت حوالي أسبوعين أقرر ما الذي سأفعله بعد ذلك. هذه المرة، أريد أن أخصص وقتا أطول لمتابعة ما حدث في مجال الذكاء الاصطناعي + الروبوتات الأوسع. لقد كنت أعيد تطبيق بعض أوراق التعلم العميق. أنا أعمل على درس تعليمي كبير لمدونتي. أنا أتعلم كل حيل كلود القوي. أقرأ منشورات مدونة Thinking Machines لأفهم أنواع التجارب التي تجرى في مختبرات الحدود. أنا أقرأ أطروحة بن كاتز لعام 2016 حول محرك الفهد الصغير. سأسافر إلى الصين في مارس للقاء شركات رائعة في منظومة الروبوتات الصينية. الآن، أكثر من أي وقت مضى، هو الوقت المناسب لكل من البشر والآلات. الرمز التالي لتسلسل حياتي سيكون مهما. إلى الزملاء والمستثمرين الذين راهنوا على 1X مبكرا، حتى قبل أن نصبح اسما مألوفا - أشكركم من أعماق قلبي. لن أنساه♥️