Ici, le cadre RL récompensait 48, mais Opus savait que la réponse était 24. Une fenêtre sur la façon dont les modèles vivent le RL