Gikk til @DvijKalaria sitt laboratorium @berkeley_ai og spilte bordtennis mot roboten hans, Oreo. Jeg hadde spilt masse bordtennis som barn. Dette føltes passende surrealistisk og et av de der «jeg skulle ønske jeg kunne fortelle mitt videregående-jeg om dette»-øyeblikkene. Bordtennis er en av de vanskeligste sportene for roboter å spille. Ballen kan bevege seg opptil 30+ mph med kraftig spinn, motstanderens intensjon er skjult, og hele kroppen må koordinere. Oreo er en full humanoid som holder en ekte padle, og den lærte viktige bevegelser som svinger ved å se Dvij demonstrere. Ingen robotinnsamlede treningsdata. Én person viser forslaget, politikken generaliserer. Slik fungerer det, slik jeg forsto det: - Et smart system (en hierarkisk planlegger) finner først ut hvor ballen skal fly og velger den beste typen slag, som forehand- eller backhand-sving. - Denne planen hjelper deretter med å trene robotens "hjerne" (en RL-policy) i en virtuell simulering. Hjernen lærer gjennom prøving og feiling, og får belønning når den etterligner noen få eksempelbevegelser - Når simulatoren er trent, blir hele oppsettet brukt på den faktiske fysiske roboten slik at den kan spille på ordentlig. De menneskelige demonstrasjonene er i hovedsak referansebevegelsene. De bygger en robot som har sett mer menneskelig bordtennis enn noe menneske, og bruker det til å utvikle sitt eget spill. Jeg vant likevel. (Så vidt. Men det varer ikke lenge)
Følg Dvijs arbeid her: Og takk @hananyss for at jeg fikk bli med!
317