😅 кто сказал, что "использование k3 в потере = использование градиента по пути"??? правильный способ использования k3 в потере — это использовать ПОЛНЫЙ градиент. в GRPO использовали k3 без коррекции IS (= градиент по пути), что неправильно. но это не вина k3!!!