Vahvistusoppiminen syntyi aivojen dopaminergisten reittien tutkimisesta. Sitten rakensimme simuloituja ympäristöjä kouluttaaksemme RL-agentteja riskittömissä ympäristöissä. Nyt? Kasvatusteknologia kysyy: miten voimme rakentaa tekoälysimulaatioita, jotta ihmiset voivat oppia todellisia taitoja riskittömästi? Elämä jäljittelee teknologiaa. James Rubin (@Google) yllättävästä silmukasta tekoälyn ja ihmisoppimisen välillä.