来自Anthropic的有趣研究: 模型越大、任务越复杂,同一个问题多跑几次,答案反而越容易不一样。