Tänään kanssamme on @rdn_nikita, @FlexionRobotics:n perustaja ja toimitusjohtaja, keskustelemassa nykyisten robotiikkakykyjen ja täysin autonomisten robottien käyttöönoton todellisen maailman vaatimusten välisestä kuilusta. Nikita selittää, miten vahvistusoppiminen ja simulaatio ovat edistäneet robottien liikkumisen nopeaa kehitystä – ja miksi liikkuminen on yhä kaukana "ratkaistua". Sukellamme sim2realin aukkoon ja siihen, miten visuaalisten syötteiden lisääminen aiheuttaa kohinaa ja monimutkaistaa sim-todenvälistä siirtoa merkittävästi. Tutkimme myös keskustelua päästä päähän -mallien ja modulaaristen lähestymistapojen välillä sekä miksi liikkumisen, suunnittelun ja semantiikan erottaminen on edelleen pragmaattinen lähestymistapa. Nikita esittelee myös käsitteen "real-to-sim", joka hyödyntää reaalimaailman dataa simulaatioparametrien hiomiseen korkeamman tarkkuuden koulutukseen, käsittelee, miten vahvistusoppiminen, jäljittelyoppiminen ja teleoperaatiodata yhdistetään kouluttamaan kestäviä politiikoita sekä nelijalkaisille että humanoidiroboteille, ja esittelee Flexionin hierarkkisen lähestymistavan, joka hyödyntää esikoulutettuja näkö-kielimalleja (VLM) korkean tason tehtävien orkestroinnissa Vision-Language-Action (VLA) -mallien ja matalan tason mallien avulla Koko kehon seurantalaitteet. Lopuksi Nikita jakaa kulissien takaisia kulisseja humanoidirobottidemoissa, näkemyksensä vahvistusoppimisesta simulaatiossa verrattuna todelliseen maailmaan, palkitsemisen hienovaraisuuksista ja tarjoaa käytännön neuvoja tutkijoille ja ammattilaisille, jotka haluavat aloittaa robotiikan parissa nykyään. 🗒️ Tämän jakson täydellisen resurssilistan löydät ohjelman muistiinpanosivulta: 📖 LUVUT =============================== 00:00 - Johdanto 04:07 - Onko robotin liikkuminen ratkaistu? 06:04 - Simulaattorin ja todellisen väli 08:58 - Semantiikan lisääminen politiikkoihin 09:42 - Modulaariset vs päästä päähän -arkkitehtuurit 10:29 - Suunnittelijamalli 12:21 - RL-tekniikoiden soveltaminen nelijalkaisista humanoideihin 15:39 - Robottidemojen takana 18:09 - Humanoidirobotit kotiympäristöissä 22:03 - Harjoituslähestymistapa 23:56 - VLA-mallit 27:59 - Simulaattorin ja todellisen eron kaventaminen 32:55 - Tehtävien orkestrointi VLM:ien avulla 36:38 - Työkalujen käyttö 38:10 - Mallihierarkia 43:37 - Simulaattori vastaan simulaatioympäristö 44:57 - Jäljittelyoppimisen ja vahvistusoppimisen yhdistäminen 46:42 - RL todellisessa maailmassa vs. RL simulaatiossa 52:58 - Palkkioviritys- ja arvofunktiot robotiikassa 56:38 - Ennusteet 1:00:10 - Humanoidit, quadroped-olennot ja pyörälliset alustat 1:02:45 - Neuvoja, suositellut robottipaketit ja yhteisön PLA