如果模型能给出思考所需时间的预测,那就太棒了。 尊重用户的时间,让他们决定等待 25 分钟的推理是否值得。