Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Cập nhật cuộc sống: Tôi đã quyết định rời 1X.
Thật vinh dự khi được giúp phát triển công ty. Tôi gia nhập Halodi Robotics vào năm 2022 (tên trước đây của công ty) với tư cách là nhân viên duy nhất ở California. Lúc đó, chúng tôi có khoảng 40 người làm việc tại Na Uy và 2 người ở Texas. Nhân viên đầu tiên của tôi và tôi đã làm việc từ gara của tôi trong vài tháng để tiết kiệm tiền. Ngày nay, 1X có hàng trăm người, với phần cứng, thiết kế, phần mềm, AI, sản xuất, sản phẩm đều được chuyển đến khu vực Vịnh SF, hoạt động hết công suất và làm việc để chuẩn bị NEO cho gia đình. Một lời cảm ơn lớn đến tất cả các đồng nghiệp mà tôi đã làm việc cùng.
Đó là một quyết định khó khăn để rời đi. Khi làm việc tại một startup thú vị đang phát triển nhanh, luôn có rất nhiều việc phải làm và không bao giờ có thời điểm hoàn hảo để chuyển tiếp. Chúng tôi có một số công việc trong ống dẫn rất thú vị vì chúng thúc đẩy đáng kể tính tự động và khả năng mở rộng của cách tiếp cận triển khai của chúng tôi và thực sự cho thấy một con đường thực tế hướng tới sản phẩm hoạt động. Cập nhật tự động hóa Mô hình Thế giới gần đây là một ví dụ, và còn nhiều điều khác đang đến. Nhà máy 1X thật sự rất thú vị. Mọi thứ đang tăng tốc với tốc độ mà tôi đã từng ngạc nhiên cách đây vài năm.
Vào năm 2022, hầu hết các nhà công nghệ, nhà nghiên cứu và nhà đầu tư mạo hiểm đều hoài nghi về robot hình người và học tập bắt chước quy mô lớn. "Tại sao lại cần chân?" "Làm thế nào mà học tập từ đầu đến cuối có thể đủ tốt?" "Tại sao lại hướng tới gia đình mà không phải nhà máy?" "Làm thế nào chúng ta có thể thu thập đủ dữ liệu?"
Cửa sổ Overton về robot đa năng đã thay đổi rất nhiều kể từ đó. Mặc dù chúng tôi vẫn còn sớm trong sứ mệnh của mình, tôi vẫn tự tin rằng sớm thôi, robot gia đình sẽ phổ biến như điều hòa không khí, ô tô và ChatGPT. Chỉ cần nói chuyện với bot, và nó sẽ đi và lặng lẽ hoàn thành công việc. Toàn bộ nền kinh tế cuối cùng sẽ được tổ chức lại xung quanh công nghệ này. Mọi người đã hiểu điều đó bây giờ.
Điều gì tiếp theo?
Tôi tin rằng tiến bộ trong học sâu ứng dụng thường dựa vào "khai thác phép thuật" của một vài đối tượng kỳ diệu. Những đối tượng kỳ diệu này sở hữu sức mạnh tổng quát vượt xa những gì người ta thường mong đợi. Chỉ cần yêu cầu LLM hiểu những gì bạn muốn là phép thuật. Các mô hình tạo video là phép thuật. Lập luận là phép thuật. Bạn không gặp phải một đối tượng kỳ diệu mỗi ngày, nhưng khi bạn gặp, bạn đảm bảo nắm bắt nó và đưa nó vào làm việc để tạo ra điều gì đó hữu ích trong robot theo cách nào đó.
Nhiều niềm tin ban đầu của tôi về hướng đi của robot là làm việc trên BC-Z từ 2018-2021. "Đối tượng kỳ diệu" mà tôi đã đặt cược vào lúc đó là khả năng hấp thụ dữ liệu đáng ngạc nhiên của học có giám sát và "chỉ cần yêu cầu tổng quát hóa". Điều này đã tiên phong nhiều thành phần tiêu chuẩn mà chúng ta thấy trong VLAs ngày nay:
- Tổng quát hóa cho các lệnh ngôn ngữ chưa thấy
- DAgger hướng dẫn con người để cải thiện chính sách
- Dự đoán phụ mở + điều khiển chân trời lùi, AKA phân đoạn hành động
- Điểm chính thao tác để cải thiện điều khiển servo
- ResNet18 đơn giản với điều kiện FiLM trên đầu vào đa phương thức
"Đối tượng kỳ diệu" tiếp theo mà chúng tôi đặt cược vào 1X là các mô hình video, vì chúng rõ ràng là những đối tượng kỳ diệu học một phân phối dữ liệu không khác gì nhiều so với những gì một robot cần học. Chúng tổng quát hóa một cách đáng ngạc nhiên.
Tôi một lần nữa cảm thấy rằng có nhiều đối tượng kỳ diệu hơn đang hoạt động bây giờ, điều này mở ra nhiều khả năng mới cho robot và hơn thế nữa. Tôi sẽ dành vài tháng để làm rỗng cốc của mình và có được góc nhìn mới. Khi tôi rời Google vào năm 2022, tôi đã dành khoảng 2 tuần để quyết định điều gì sẽ làm tiếp theo. Lần này, tôi muốn dành nhiều thời gian hơn để cập nhật những gì đã xảy ra trong không gian AI + robot rộng lớn hơn.
Tôi đã tái triển khai một số tài liệu học sâu. Tôi đang làm một hướng dẫn lớn cho blog của mình. Tôi đang học tất cả các mẹo người dùng quyền lực của Claude. Tôi đang đọc các bài viết trên blog Thinking Machines để hiểu những loại thí nghiệm nào đang được thực hiện tại các phòng thí nghiệm tiên phong. Tôi đang đọc luận văn của Ben Katz năm 2016 về bộ truyền động Mini-cheetah. Tôi sẽ đi du lịch đến Trung Quốc vào tháng 3 để gặp gỡ những công ty tuyệt vời trong hệ sinh thái robot Trung Quốc. Bây giờ, hơn bao giờ hết, là thời điểm cho cả con người và máy móc học hỏi. Mã thông báo tiếp theo trong chuỗi cuộc sống của tôi sẽ là một điều quan trọng.
Đến các đồng nghiệp và nhà đầu tư đã đặt cược vào 1X sớm, ngay cả trước khi chúng tôi trở thành một cái tên quen thuộc - tôi cảm ơn bạn từ đáy lòng mình. Tôi sẽ không quên điều đó♥️
Hàng đầu
Thứ hạng
Yêu thích
