🚨Kertas 🚨 Bagaimana jika LLM dapat memberi tahu Anda bahwa mereka akan gagal sebelum mereka selesai bernalar? Kami melatih model untuk memprediksi masa depan mereka sendiri: apakah mereka akan berhasil dan berapa lama waktu yang dibutuhkan. Di setiap token, secara real time, tanpa komputasi tambahan. Kami menggunakan ini untuk mengembangkan algoritma pengambilan sampel adaptif untuk komputasi waktu pengujian. 👇🧵