Condivido la trascrizione nel caso in cui, come me, l'abbiate cercata di recente e non siate riusciti a trovarla. Roon (@tszzl): “Ogni volta che alleni un modello, potresti non cambiare nulla nel dataset, e poi eseguire un nuovo seed RL, e avresti una personalità leggermente diversa. È perché c'è una certa varianza nel processo di addestramento. È casuale - stai facendo una passeggiata casuale nello spazio del modello. Non possiamo nemmeno riprodurre una personalità nello stesso run di addestramento così facilmente, tanto meno nel corso del tempo ... È una domanda molto difficile internamente [in OpenAI]. Cerchiamo di minimizzare la deriva della personalità, perché le persone iniziano ad amare i modelli, ma è un problema molto difficile.”