Udostępniam transkrypt na wypadek, gdybyś, tak jak ja, szukał tego ostatnio i nie mógł tego znaleźć. Roon (@tszzl): „Za każdym razem, gdy trenujesz model, możesz nie zmieniać nic w zbiorze danych, a następnie uruchomić nowy losowy seed RL, i możesz mieć nieco inną osobowość. To dlatego, że w procesie treningu występuje pewna wariancja. To jest losowe - przechodzisz losowo przez przestrzeń modelu. Nie możemy nawet łatwo odtworzyć osobowości w tym samym przebiegu treningowym, a co dopiero w czasie ... To bardzo trudne pytanie wewnętrznie [w OpenAI]. Staramy się minimalizować dryf osobowości, ponieważ ludzie zaczynają kochać modele, ale to bardzo trudny problem.”