Sdílím přepis pro případ, že jste to nedávno hledali a nenašli jste to. Roon (@tszzl): "Pokaždé, když trénujete model, možná nic na datové sadě nezměníte, a pak spustíte nový RL seed, a budete mít trochu jinou osobnost. Je to proto, že v procesu školení dochází k určitým rozdílům. Je to náhodné – procházíte se modelovým prostorem. Ani osobnost nemůžeme tak snadno reprodukovat ve stejném tréninkovém běhu, natož napříč všemi časy ... Je to velmi obtížná otázka interně [v OpenAI]. Snažíme se minimalizovat osobnostní posuny, protože lidé si modely začnou zamilovat, ale je to velmi těžký problém."