Sjekk ut vår nyeste forskning ledet av @rohin_manvi om adaptiv testtidsberegning.
LLM-er kan trenes til å forutsi sin egen fremtid, hvor godt de presterer og i hvilken tid.
Denne mekanismen kan brukes som en ny prøvetakingsstrategi for å forbedre effektiviteten av testtidsberegning.
🚨Avis 🚨
Hva om LLM-er kunne fortelle deg at de kommer til å stryke før de er ferdige med å resonnere?
Vi trente modeller til å forutsi sin egen fremtid: om de vil lykkes og hvor lang tid det vil ta. Ved hver token, i sanntid, uten ekstra beregning.
Vi brukte dette til å utvikle en adaptiv utvalgsalgoritme for testtidsberegning. 👇🧵