Arvofunktioilla on tärkeä rooli RL:ssä, ja yhä useammin ne tulevat olemaan tärkeässä roolissa LLM:ien RL:ssä. Tämä uusi @rohin_manvi:n johtama artikkeli on askel tähän suuntaan: arvofunktioiden hyödyntäminen testiaikalaskennan optimointiin adaptiivisen laskennan avulla.