Endelig funnet en god brukssak for underagenter. Gjør policymodeller smartere ved automatisk å bygge RL Enviornments fra virkelige oppgavedata. Fy faen, det fungerer faktisk