Hari ini, kami bergabung dengan @rdn_nikita, salah satu pendiri dan CEO @FlexionRobotics untuk membahas kesenjangan antara kemampuan robot saat ini dan apa yang diperlukan untuk menerapkan robot yang sepenuhnya otonom di dunia nyata. Nikita menjelaskan bagaimana pembelajaran penguatan dan simulasi telah mendorong kemajuan pesat dalam penggerak robot—dan mengapa penggerak masih jauh dari "terpecahkan". Kami menggali kesenjangan sim2real, dan bagaimana menambahkan input visual memperkenalkan noise dan secara signifikan mempersulit transfer sim-ke-nyata. Kami juga mengeksplorasi perdebatan antara model end-to-end dan pendekatan modular, dan mengapa memisahkan gerak, perencanaan, dan semantik tetap menjadi pendekatan pragmatis saat ini. Nikita juga memperkenalkan konsep "real-to-sim", yang menggunakan data dunia nyata untuk menyempurnakan parameter simulasi untuk pelatihan fidelitas yang lebih tinggi, membahas bagaimana pembelajaran penguatan, pembelajaran imitasi, dan data teleoperasi digabungkan untuk melatih kebijakan yang kuat untuk robot berkaki empat dan humanoid, dan memperkenalkan pendekatan hierarkis Flexion yang menggunakan Model Visi-Bahasa (VLM) yang telah dilatih sebelumnya untuk orkestrasi tugas tingkat tinggi dengan model Vision-Language-Action (VLA) dan tingkat rendah pelacak seluruh tubuh. Akhirnya, Nikita berbagi di balik layar dalam demo robot humanoid, pandangannya tentang pembelajaran penguatan dalam simulasi versus dunia nyata, nuansa penyetelan hadiah, dan menawarkan saran praktis bagi peneliti dan praktisi yang ingin memulai robotika saat ini. 🗒️ Untuk daftar lengkap sumber daya untuk episode ini, kunjungi halaman catatan pertunjukan: 📖 BAB =============================== 00:00 - Pendahuluan 04:07 - Apakah penggerak robot terpecahkan? 06:04 - Kesenjangan Sim-ke-nyata 08:58 - Menambahkan semantik ke kebijakan 09:42 - Arsitektur modular vs end-to-end 10:29 - Model perencana 12:21 - Mengadaptasi teknik RL dari berkaki empat menjadi humanoid 15:39 - Di balik demo robot 18:09 - Robot humanoid di lingkungan rumah 22:03 - Pendekatan pelatihan 23:56 - Model VLA 27:59 - Menutup celah sim-to-real 32:55 - Orkestrasi tugas menggunakan VLM 36:38 - Penggunaan alat 38:10 - Hierarki model 43:37 - Simulator versus lingkungan simulasi 44:57 - Menggabungkan pembelajaran imitasi dan pembelajaran penguatan 46:42 - RL di dunia nyata versus RL dalam simulasi 52:58 - Penyetelan hadiah dan fungsi nilai dalam robotika 56:38 - Prediksi 1:00:10 - Humanoid, tali empat, dan platform beroda 1:02:45 - Saran, kit robot yang direkomendasikan, dan pla komunitas