😅 ¿quién dijo que "usar k3 en la pérdida = usar gradiente por camino"??? la forma correcta de usar k3 en la pérdida es usar el gradiente COMPLETO. OG GRPO usó k3 sin corrección IS (= gradiente por camino), lo cual está mal. ¡pero no es culpa de k3!!!