фундаментальна проблема RL-інінгу для коректності в кодігенерації, здається, полягає в тому, що моделі навчаються писати код, здатний обробляти будь-який крайній випадок Чудові інженери знають, що дивні дрібні помилки — це велика проблема. Вони свідчать про фундаментальну відсутність розуміння. Сучасні моделі так не думають