Dziś przyjeżdżam do mjlab! To jest vanilla RL, bez imitacji ruchu/AMP. Naturalne chody pojawiają się z minimalnych nagród: śledzenie prędkości, wyprostowana postawa, regulacja stawów dostosowana do prędkości oraz jakość kontaktu (prześwit stopy, poślizg, miękkie lądowania). Brak trajektorii odniesienia lub wzorców chodu. Chodzenie, bieganie i machanie rękami pojawiają się wyłącznie w wyniku optymalizacji tych prostych celów. A czas treningu? Tylko 1 godzina.