Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Fui ao laboratório do @DvijKalaria @berkeley_ai e joguei pingue-pongue contra seu robô, Oreo. Eu jogava muito pingue-pongue quando era criança. Isso parecia apropriadamente surreal e um daqueles momentos "eu gostaria de poder contar isso ao meu eu do ensino médio".
O tênis de mesa é um dos esportes mais difíceis para robôs jogarem. A bola pode se mover a mais de 30 mph com uma forte rotação, a intenção do oponente humano é oculta, e todo o corpo precisa se coordenar. Oreo é um humanoide completo segurando uma raquete de verdade, e aprendeu movimentos chave como os swings assistindo Dvij demonstrar. Nenhum dado de treinamento coletado por robôs. Uma pessoa mostra o movimento, a política generaliza.
A forma como funciona, pelo que entendi:
- Um sistema inteligente (um planejador hierárquico) primeiro descobre para onde a bola vai voar e escolhe o melhor tipo de golpe, como um swing de forehand ou backhand.
- Este plano então ajuda a treinar o "cérebro" do robô (uma política de RL) em uma simulação virtual. O cérebro aprende por tentativa e erro, recebendo recompensas quando imita alguns movimentos de exemplo.
- Uma vez treinado na simulação, todo o conjunto é aplicado ao robô físico real para que ele possa jogar de verdade.
As demonstrações humanas são essencialmente os movimentos de referência.
Eles estão construindo um robô que assistiu mais tênis de mesa humano do que qualquer humano, e usa isso para desenvolver seu próprio jogo.
Eu ainda ganhei. (Por pouco. Mas isso não vai durar)
Siga o trabalho do Dvij aqui:
E obrigado @hananyss por me deixar acompanhar!
311
Top
Classificação
Favoritos
