Bạn có biết những video trình diễn robot lấp lánh đang lan truyền trên X không? Đừng bị mắc lừa bởi chúng. Robot hình người ngày nay là những cosplayer đắt tiền trị giá 20.000 đô la. Để có được những cỗ máy thực sự quan trọng, chúng ta phải rời bỏ kỷ nguyên điều khiển từ xa và bước vào kỷ nguyên của những cỗ máy tự cải thiện. Dưới đây là cách tôi thấy mọi thứ diễn ra, trong 3 giai đoạn: Giai đoạn 1: Kỷ nguyên hẹp (2025-2027) Robot hình người rất dễ vỡ. Các hệ thống hiện tại phụ thuộc vào các mô hình chính xác về môi trường của chúng. Nếu bạn di chuyển một cái cốc hai inch sang trái hoặc đổ bóng lên một cảm biến, robot sẽ thất bại. Trong 12-24 tháng tới, chúng ta sẽ thấy các triển khai, nhưng chúng sẽ bị hạn chế rất nhiều. Vận chuyển hộp trong các kho hàng có cấu trúc. Gấp quần áo (vẫn kém). Pha cà phê. Kinh tế ở đây rất tệ. Một Unitree G1 nâng 2kg chỉ là một món đồ trang trí. Một con người thì rẻ hơn, mạnh mẽ hơn và thông minh hơn. Nhưng những người tiên phong và các nhà nghiên cứu sẽ không quan tâm. Họ sẽ mua chúng để thử nghiệm giới hạn. Giai đoạn này sẽ là về việc thiết lập cơ sở. --- Giai đoạn 2: Bánh đà dữ liệu (Cuối 2026-2028) Đây là giai đoạn bị hiểu lầm nhiều nhất. 100.000 robot hình người đầu tiên không cần phải giỏi trong công việc của chúng. Chúng chỉ cần tồn tại. Chúng ta đang bắt đầu từ dữ liệu bằng không. Để giải quyết trí thông minh tổng quát, chúng ta cần khối lượng. Chúng ta cần robot va vào đồ đạc, làm rơi đĩa và không mở được cửa. Mỗi thất bại là một điểm dữ liệu được gán nhãn. Đây là lúc vòng lặp trở nên chặt chẽ: Triển khai -> Thất bại -> Thu thập dữ liệu -> Cập nhật -> Triển khai lại RLHF và đào tạo sim-to-real sẽ trở thành điều thường xuyên. Bánh đà bắt đầu quay: nhiều trường hợp biên thực tế hơn dẫn đến dữ liệu mô phỏng tốt hơn, điều này dẫn đến ít thất bại hơn, cho phép triển khai lớn hơn....