Finjustering med GRPO, visuellt förklarat: