Dlouhé kontexty umožňují dlouhé horizonty. Dlouhé horizonty umožňují silnější zobecnění RL. Trénink testovacího času činí horizont prakticky nekonečným. Co se stane s reálným výkonem v tomto režimu?