Сегодня к нам присоединился @rdn_nikita, соучредитель и генеральный директор @FlexionRobotics, чтобы обсудить разрыв между текущими возможностями роботов и тем, что необходимо для развертывания полностью автономных роботов в реальном мире. Никита объясняет, как обучение с подкреплением и симуляция способствовали быстрому прогрессу в локомоции роботов — и почему локомоция все еще далека от "решенной". Мы углубляемся в разрыв sim2real и обсуждаем, как добавление визуальных данных вводит шум и значительно усложняет передачу от симуляции к реальности. Мы также исследуем дебаты между моделями end-to-end и модульными подходами, и почему разделение локомоции, планирования и семантики остается прагматичным подходом сегодня. Никита также вводит концепцию "real-to-sim", которая использует данные из реального мира для уточнения параметров симуляции для более точного обучения, обсуждает, как обучение с подкреплением, имитационное обучение и данные телеприсутствия комбинируются для обучения надежных политик как для четвероногих, так и для гуманоидных роботов, и представляет иерархический подход Flexion, который использует предварительно обученные модели Vision-Language (VLM) для высокоуровневой оркестрации задач с моделями Vision-Language-Action (VLA) и низкоуровневыми трекерами всего тела. Наконец, Никита делится закулисной информацией о демонстрациях гуманоидных роботов, своим мнением о обучении с подкреплением в симуляции по сравнению с реальным миром, нюансами настройки вознаграждений и предлагает практические советы для исследователей и практиков, желающих начать работу в области робототехники сегодня. 🗒️ Для полного списка ресурсов для этого эпизода посетите страницу заметок шоу: 📖 ГЛАВЫ =============================== 00:00 - Введение 04:07 - Решена ли локомоция роботов? 06:04 - Разрыв sim-to-real 08:58 - Добавление семантики в политики 09:42 - Модульные против end-to-end архитектур 10:29 - Модель планировщика 12:21 - Адаптация техник RL от четвероногих к гуманоидным 15:39 - За кулисами демонстраций роботов 18:09 - Гуманоидные роботы в домашних условиях 22:03 - Подход к обучению 23:56 - Модели VLA 27:59 - Закрытие разрыва sim-to-real 32:55 - Оркестрация задач с использованием VLM 36:38 - Использование инструментов 38:10 - Иерархия моделей 43:37 - Симулятор против среды симуляции 44:57 - Комбинирование имитационного обучения и обучения с подкреплением 46:42 - RL в реальном мире против RL в симуляции 52:58 - Настройка вознаграждений и функции ценности в робототехнике 56:38 - Прогнозы 1:00:10 - Гуманоиды, четвероногие и колесные платформы 1:02:45 - Советы, рекомендуемые наборы роботов и сообщество