Ich teile das Transkript, falls du, wie ich, kürzlich danach gesucht hast und es nicht finden konntest. Roon (@tszzl): „Jedes Mal, wenn du ein Modell trainierst, änderst du möglicherweise nichts am Datensatz und führst dann einen neuen RL-Seed aus, und du hättest eine leicht andere Persönlichkeit. Das liegt daran, dass es eine gewisse Varianz im Trainingsprozess gibt. Es ist zufällig - du machst einen zufälligen Spaziergang durch den Modellraum. Wir können nicht einmal eine Persönlichkeit im selben Trainingslauf so leicht reproduzieren, geschweige denn über alle Zeit ... Es ist eine sehr schwierige Frage intern [bei OpenAI]. Wir versuchen, die Persönlichkeitsdrift zu minimieren, weil die Leute die Modelle lieben, aber es ist ein sehr hartes Problem.“