Kommer till mjlab idag! Det här är vanilla RL, ingen rörelseimitation/AMP. Naturliga gångarter uppstår ur minimala belöningar: hastighetsspårning, upprätt bål, hastighetsadaptiv ledregularisering och kontaktkvalitet (fotfrigång, glidning, mjuka landningar). Inga referensbanor eller gångmönster. Att gå, springa och svänga armarna kommer enbart från att optimera dessa enkla mål. Åh och träningstid? Bara 1 timme.