o problemă fundamentală a RL-ing-ului pentru corectitudine pe codegen pare să fie modelele care învață să scrie cod care poate gestiona orice caz limită Inginerii mari știu că mici erori ciudate sunt o mare problemă. ele indică o lipsă fundamentală de înțelegere. Modelele actuale nu gândesc așa