Le funzioni di valore svolgono un ruolo importante nel RL e, sempre di più, giocheranno un ruolo importante nel RL per gli LLM. Questo nuovo articolo guidato da @rohin_manvi è un passo in questa direzione: utilizzare le funzioni di valore per ottimizzare il calcolo al momento del test con computazione adattiva.