Meta 剛剛在 Hugging Face 上發布了一個新的模型,用於驗證 Chain-of-Thought 推理。 這是一個基於 Llama 3.1 8B Instruct 的 TopK 轉碼器,提供了一種白盒方法來理解和修正推理錯誤。