DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Berbagi transkrip untuk berjaga-jaga, seperti saya, Anda mencari ini baru-baru ini dan tidak dapat menemukannya. Roon (@tszzl): "Setiap kali Anda melatih model, Anda mungkin tidak mengubah apa pun tentang himpunan data, dan kemudian menjalankan benih RL baru, dan Anda akan memiliki kepribadian yang sedikit berbeda. Itu karena ada beberapa variasi dalam proses pelatihan. Ini acak - Anda berjalan-jalan secara acak melalui ruang model. Kami bahkan tidak dapat mereproduksi kepribadian dalam latihan yang sama dengan mudah, apalagi sepanjang masa ... Ini adalah pertanyaan yang sangat sulit secara internal [di OpenAI]. Kami mencoba meminimalkan penyimpangan kepribadian, karena orang-orang menyukai modelnya, tetapi itu adalah masalah yang sangat sulit."

Teratas

Peringkat

Favorit