Jaan transkription siltä varalta, että kuten minä, etsit tätä äskettäin etkä löytänyt sitä. Roon (@tszzl): "Joka kerta kun koulutat mallia, et välttämättä muuta mitään aineistossa, ja sitten ajat uuden RL-siemenen, jolloin persoonallisuus olisi hieman erilainen. Se johtuu siitä, että koulutusprosessissa on jonkin verran vaihtelua. Se on satunnaista – kävelet satunnaisesti mallitilassa. Emme voi edes toistaa persoonallisuutta samassa harjoitusjuoksussa niin helposti, saati sitten koko ajan ... Se on hyvin vaikea kysymys sisäisesti [OpenAI:ssa]. Yritämme minimoida persoonallisuuden vaihtelua, koska ihmiset alkavat rakastaa malleja, mutta se on todella vaikea ongelma."