Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Robo-Dopamina: Il cambiamento di gioco nella precisione robotica – Processi di ricompensa che imitano l'intuizione umana!
Questo articolo innovativo introduce Robo-Dopamina, un framework che sposta l'apprendimento robotico da ricompense basate su risultati grezzi a ricompense sofisticate orientate ai processi.
Addestrando su un enorme dataset multi-view di oltre 3.400 ore, il loro Modello di Ricompensa Generale (GRM) raggiunge un'accuratezza del 92,8% nella valutazione dei progressi nella manipolazione, fondendo prospettive per gestire occlusioni e dettagli fini come mai prima d'ora.
Nei test nel mondo reale su compiti come piegare asciugamani o impilare cubi, la loro politica Dopamina-RL fa schizzare i tassi di successo al 95% con solo 150 rollout – circa un'ora di tempo robotico!
Osservazioni interessanti:
• Evita il "tranello semantico" nella modellazione delle ricompense tradizionali, garantendo che le politiche si ottimizzino senza rimanere bloccate in loop subottimali – una vittoria teorica per l'AI affidabile.
• Generalizza in modo straordinario: Da simulazioni a realtà, oggetti e layout non visti, perdendo solo l'8-20% negli scenari OOD rispetto al 50-60% dei concorrenti.
• Implicazioni? Chirurghi, fabbriche e assistenti domestici potrebbero presto gestire operazioni delicate con una finezza simile a quella umana, riducendo errori e tempi di addestramento.
Oggi lo testerò!
Articolo completo: –

Principali
Ranking
Preferiti
