Creo que podrías crear un entorno de vida real que alinee los catros con sus verdaderos estados internos para poder usar los tokens de su catre para mayor veracidad y también mejorar sus capacidades introspectivas al mismo tiempo
Bartosz Cywinski
Bartosz Cywinski23 dic, 03:15
¿Podemos entender la cadena de pensamiento (CoT) de los LLMs de razonamiento latente usando las técnicas actuales de interpretación mecánica? Resulta que podemos descubrir una estructura interpretable, al menos en problemas matemáticos sencillos. En un estudio breve mostramos que los vectores latentes representan, por ejemplo, Cálculos intermedios
¿Puedes probar esto con Claude y hacer una entrada en el blog @_sholtodouglas por favor, gracias
28