fundamentalnym problemem RL-ing w zakresie poprawności generowania kodu wydaje się być to, że modele uczą się pisać kod, który potrafi obsługiwać każdy przypadek brzegowy świetni inżynierowie wiedzą, że dziwne małe błędy to poważna sprawa. wskazują one na fundamentalny brak zrozumienia. obecne modele nie myślą w ten sposób.