Ajuste fino usando GRPO, explicado visualmente: