Împărtășesc foaia matricolă în caz că, la fel ca mine, ai căutat recent și nu ai găsit-o. Roon (@tszzl): "De fiecare dată când antrenezi un model, s-ar putea să nu schimbi nimic în setul de date, apoi să rulezi o nouă sămânță RL, iar personalitatea ta va fi ușor diferită. Este pentru că există unele variații în procesul de antrenament. Este aleatoriu – faci o plimbare aleatorie prin spațiul modelului. Nici măcar nu putem reproduce o personalitate atât de ușor în același antrenament, cu atât mai puțin de-a lungul timpului ... Este o întrebare foarte dificilă intern [la OpenAI]. Încercăm să minimizăm derivația de personalitate, pentru că oamenii ajung să iubească modelele, dar este o problemă foarte dificilă."