🚨Paper 🚨 Wat als LLM's je konden vertellen dat ze gaan falen voordat ze hun redeneervermogen hebben voltooid? We hebben modellen getraind om hun eigen toekomst te voorspellen: of ze zullen slagen en hoe lang het zal duren. Bij elk token, in real-time, zonder extra rekentijd. We hebben dit gebruikt om een adaptief sampling-algoritme te ontwikkelen voor rekentijd tijdens tests. 👇🧵