Deler transkripsjonen i tilfelle, som meg, du søkte etter dette nylig og ikke fant det. Roon (@tszzl): «Hver gang du trener en modell, endrer du kanskje ingenting ved datasettet, og så kjører du et nytt RL-frø, og du får en litt annerledes personlighet. Det er fordi det er noe variasjon i opplæringsprosessen. Det er tilfeldig – du tar en tilfeldig tur gjennom modellrommet. Vi klarer ikke engang å gjenskape en personlighet i samme treningsløp så lett, langt mindre på tvers av alle tider ... Det er et veldig vanskelig spørsmål internt [hos OpenAI]. Vi prøver å minimere personlighetsforskjeller, fordi folk kommer til å elske modellene, men det er et veldig vanskelig problem.»