Сьогодні до нас приєднується @rdn_nikita, співзасновник і генеральний директор @FlexionRobotics, щоб обговорити розрив між поточними робототехнічними можливостями та тим, що потрібно для впровадження повністю автономних роботів у реальному світі. Нікіта пояснює, як підкріплююче навчання та симуляція сприяли швидкому прогресу в роботизованій локомації — і чому локомосія досі далека від «розв'язання». Ми детально аналізуємо розрив між sim2real і те, як додавання візуальних вхідних даних додає шум і суттєво ускладнює передачу симулятора в реальність. Ми також досліджуємо дискусію між наскрізними моделями та модульними підходами, а також чому розділення руху, планування та семантики залишається прагматичним підходом і сьогодні. Нікіта також вводить концепцію «real-to-sim», яка використовує реальні дані для уточнення параметрів симуляції з метою навчання з вищою точністю, обговорює, як поєднуються дані з підкріплення, імітаційного навчання та телеопераційні дані для навчання надійним політикам як чотириногих, так і гуманоїдних роботів, а також вводить ієрархічний підхід Flexion, який використовує попередньо навчені моделі Vision-Language Models (VLM) для оркестрації завдань на високому рівні з моделями Vision-Language-Action (VLA) та низькорівневими моделями Трекери всього тіла. Нарешті, Нікіта ділиться закулісами демонстрацій гуманоїдних роботів, своїм поглядом на навчання з підкріпленням у симуляції та реальному світі, нюансами налаштування винагород і дає практичні поради дослідникам і практикам, які хочуть розпочати роботу в робототехніці вже сьогодні. 🗒️ Повний список ресурсів для цього епізоду відвідайте сторінку нотаток до шоу: 📖 РОЗДІЛИ =============================== 00:00 - Вступ 04:07 - Чи вирішено проблему з роботизованим рухом? 06:04 - Розрив від симулятора до реальності 08:58 - Додавання семантики до політик 09:42 - Модульна та наскрізна архітектура 10:29 - Модель планувальника 12:21 - Адаптація технік реального життя від чотириногих до гуманоїдів 15:39 - За демо-роботами 18:09 - Гуманоїдні роботи в домашніх умовах 22:03 - Тренувальний підхід 23:56 - VLA моделі 27:59 - Скорочення розриву між симулятором і реальністю 32:55 - Оркестрація завдань за допомогою VLM 36:38 - Використання інструментів 38:10 - Ієрархія моделей 43:37 - Симулятор проти симуляційного середовища 44:57 - Поєднання імітації та підкріплення навчання 46:42 - RL у реальному світі проти RL у симуляції 52:58 - Налаштування винагороди та функції цінності в робототехніці 56:38 - Прогнози 1:00:10 - Гуманоїди, квадропеди та платформи на колісах 1:02:45 - Поради, рекомендовані набори роботів і спільнота PLA