我覺得你可以創建一個強化學習環境,使得成本與其真實內部狀態對齊,這樣你就可以利用其成本中的代幣來提高真實性,同時也能改善其內省能力。
Bartosz Cywinski
Bartosz Cywinski2025年12月23日
我們能否利用當前的機械解釋技術來理解潛在推理 LLM 的思維鏈(CoT)? 事實證明,我們可以揭示可解釋的結構,至少在簡單的數學問題上! 在一項簡短的研究中,我們顯示潛在向量代表例如中間計算。
你能在 Claude 上試試這個並寫一篇博客文章嗎 @_sholtodouglas 謝謝
70