Gud, den fremste intellektet, RL-beboerne har kokt så hardt En stor flaskehals i kontinuerlig læring er at vi ikke har en generell måte å sammenligne og evaluere metoder på tvers av oppgavedomener Jeg tror @carnot_cyclist kan ha løst dette
Jeg skal ikke spoile det, for jeg vil at han skal skrive et fantastisk blogginnlegg om det. Men wow, det er bare en veldig, veldig ren formalisme som kan brukes til så mange forskjellige ting, og han har noen fine tidlige eksperimentelle resultater å vise frem
154