Bekijk ons nieuwste onderzoek geleid door @rohin_manvi over adaptieve test-tijd berekeningen.
LLM's kunnen worden getraind om hun eigen toekomst te voorspellen, over hoe goed ze presteren en in welke tijd.
Dit mechanisme kan worden gebruikt als een nieuwe steekproefstrategie om de efficiëntie van test-tijd berekeningen te verbeteren.
🚨Paper 🚨
Wat als LLM's je konden vertellen dat ze gaan falen voordat ze hun redeneervermogen hebben voltooid?
We hebben modellen getraind om hun eigen toekomst te voorspellen: of ze zullen slagen en hoe lang het zal duren. Bij elk token, in real-time, zonder extra rekentijd.
We hebben dit gebruikt om een adaptief sampling-algoritme te ontwikkelen voor rekentijd tijdens tests. 👇🧵