今日はmjlabに来ます!これはバニラRL、モーション模倣なし/AMPです。自然な歩行は、速度追跡、直立した胴体、速度適応関節の正則化、接触の質(足のクリアランス、スリップ、ソフトランディング)など、最小限の報酬から生まれます。基準軌道や歩行パターンはありません。ウォーキング、ランニング、腕の振りは、純粋にこれらの単純な目標を最適化することから生まれます。ああ、トレーニングの時間は?たった1時間。