Simt că ai putea crea un mediu RL care să alinieze paturile cu stările sale interne reale, astfel încât să poți folosi jetoanele din pat pentru sinceritate și, în același timp, să-i îmbunătățești capacitățile introspective
Bartosz Cywinski
Bartosz Cywinski23 dec., 03:15
Putem înțelege lanțul de gândire (CoT) al LLM-urilor cu raționament latent folosind tehnicile actuale de interpretare mecanică? Se pare că putem descoperi o structură interpretabilă, cel puțin la probleme matematice simple! Într-un studiu scurt arătăm că vectorii latenți reprezintă, de exemplu, Calcule intermediare
Poți încerca asta pe Claude și să faci o postare pe blog @_sholtodouglas te rog, mulțumesc
33