Sejauh ini "menceritakan cerita panjang menengah yang memuaskan dan ditulis dengan baik" telah terbukti jauh lebih sulit bagi LLM daripada bukti matematis, pembuatan musik, laporan penelitian, kode, dan banyak bentuk pekerjaan lainnya. Alasan teknisnya cukup jelas, tetapi seharusnya menjadi model bahasa
Salah satu alasan utamanya adalah sulit untuk memverifikasi tulisan yang benar-benar bagus, jadi Anda tidak dapat melakukan RL yang baik di atasnya. Namun, saya menduga bahwa tweet di atas akan dikutip yang di-tweet sekitar tahun ini dengan contoh tulisan yang sangat bagus yang dibuat oleh LLM dari awal, jadi kita akan lihat.
84