god de prime intellect RL bewoners hebben zo hard gekookt een belangrijke bottleneck in continu leren is dat we geen algemene manier hebben om methoden over taakdomeinen te vergelijken en te evalueren ik denk dat @carnot_cyclist dit misschien heeft opgelost
ik wil het niet verpesten omdat ik wil dat hij een geweldige blogpost erover schrijft. maar wauw, het is gewoon een echt, echt nette formalisering die voor zoveel verschillende dingen kan worden gebruikt, en hij heeft een aantal mooie vroege experimentele resultaten om het te laten zien.
148