Delar transkriptet ifall du, precis som jag, nyligen sökte efter detta och inte kunde hitta det. Roon (@tszzl): "Varje gång du tränar en modell kanske du inte ändrar något i datasetet, och sedan kör du ett nytt RL-frö, och du får en något annorlunda personlighet. Det beror på att det finns viss variation i utbildningsprocessen. Det är slumpmässigt – du tar en slumpmässig promenad genom modellrummet. Vi kan inte ens återskapa en personlighet i samma träningspass så lätt, än mindre över hela tiden ... Det är en mycket svår fråga internt [på OpenAI]. Vi försöker minimera personlighetsskillnaderna, eftersom folk kommer att älska modellerna, men det är ett väldigt svårt problem."