Sento che potresti creare un ambiente rl che allinei i cots con i loro veri stati interni in modo da poter utilizzare i token nel suo cot per la veridicità e migliorare anche le sue capacità introspettive allo stesso tempo
Bartosz Cywinski
Bartosz Cywinski23 dic, 03:15
Possiamo comprendere il chain-of-thought (CoT) dei LLM di ragionamento latente utilizzando le attuali tecniche di interpretazione meccanica? Si scopre che possiamo svelare una struttura interpretabile, almeno su semplici problemi matematici! In un breve studio mostriamo che i vettori latenti rappresentano, ad esempio, calcoli intermedi.
Puoi provare questo su Claude e fare un post sul blog @_sholtodouglas per favore grazie
20