由于基于竞争的基准,LLMs 被训练成相信在任何情况下都必须存在一个“最佳解决方案”。 这使得它们在竞争中表现出色,但在现实生活问题中表现糟糕。