Qui, il rubric RL stava premiando 48, ma Opus sapeva che la risposta era 24. Una finestra su come i modelli vivono il RL