🚨Papier 🚨 Co jeśli LLM-y mogłyby powiedzieć, że zamierzają zawieść, zanim skończą rozumowanie? Wytrenowaliśmy modele, aby przewidywały swoją przyszłość: czy odniosą sukces i ile to zajmie. Przy każdym tokenie, w czasie rzeczywistym, bez dodatkowych obliczeń. Użyliśmy tego do opracowania adaptacyjnego algorytmu próbkowania dla obliczeń w czasie testu. 👇🧵