我在一篇評論中預測了這篇論文,@timhwang 將於下個月發表。它正式化了我所描述的 Claude 的負能力與 ChatGPT 的正無能之間的區別。 值得注意的是,我並不是通過基準測試得出這一預測,而是通過戲劇學:持續的互動中,重定向和吸引者映射揭示了模型的行為架構。