Мне кажется, вы могли бы создать rl-среду, которая согласует cots с его истинными внутренними состояниями, чтобы вы могли использовать токены в его cot для правдивости и одновременно улучшить его интроспективные способности.
Bartosz Cywinski
Bartosz Cywinski23 дек., 03:15
Можем ли мы понять цепочку размышлений (CoT) латентных моделей LLM с использованием текущих методов интерпретации механики? Оказывается, мы можем выявить интерпретируемую структуру, по крайней мере, на простых математических задачах! В коротком исследовании мы показываем, что латентные векторы представляют, например, промежуточные вычисления.
Можешь попробовать это на Claude и сделать пост в блоге @_sholtodouglas, пожалуйста, спасибо.
25