Forscher haben einen humanoiden Roboter trainiert, um Tennis zu spielen, und das nur mit 5 Stunden Bewegungsdaten. Der Roboter kann jetzt mehrschüssige Ballwechsel mit menschlichen Spielern aufrechterhalten und schlägt Bälle, die mit >15 m/s reisen, mit einer Erfolgsquote von ~90%. AlphaGo für jeden Sport kommt.
Es gibt jetzt einen ziemlich klaren Weg, ein Modell zu trainieren, das so gut ist wie ein professioneller Spieler, indem man die Bewegungsdaten für einen vielfältigeren latenten Aktionsraum (die Vielfalt und Robustheit der Tennisfähigkeiten erweitern) und auch das RL mit Selbstspiel skaliert, um Strategien zu lernen.
Quelle: Autor: @Zhikai273
1,65K