我在一篇评论中预测了这篇论文,@timhwang 将在下个月发布。它正式化了我所描述的 Claude 的负能力与 ChatGPT 的正无能之间的区别。 值得注意的是,我并不是通过基准测试得出这个预测的,而是通过戏剧性:持续的互动中,重定向和吸引子映射揭示了模型的行为架构。