Sinto que você poderia criar um ambiente real que alinhe os cats com seus verdadeiros estados internos, para que você possa usar os tokens no catre para ser mais honesto e também melhorar suas capacidades introspectivas ao mesmo tempo
Bartosz Cywinski
Bartosz Cywinski23 de dez., 03:15
Podemos entender a cadeia de pensamento (CoT) dos LLMs de raciocínio latente usando técnicas atuais de interpretação mecânica? Acontece que podemos descobrir uma estrutura interpretável, pelo menos em problemas matemáticos simples! Em um estudo curto, mostramos que vetores latentes representam, por exemplo, Cálculos intermediários
Você pode tentar isso no Claude e fazer um post no blog @_sholtodouglas por favor, obrigado
28