Ділюся транскриптом на випадок, якщо, як і я, ви нещодавно шукали це і не змогли знайти. Рун (@tszzl): «Кожного разу, коли ви навчаєте модель, ви можете нічого не змінювати в наборі даних, а потім запускати нове RL-сід, і у вас буде трохи інша особистість. Це через певні відмінності в процесі навчання. Це випадково — ви просто проходите простір моделей. Ми навіть не можемо так легко відтворити особистість в одному тренуванні, не кажучи вже про всі часи... Це дуже складне питання всередині OpenAI. Ми намагаємося мінімізувати відхилення характеру, бо люди починають любити моделей, але це дуже складна проблема.»