我們思考的嚴謹性悲劇在於,當大型語言模型(LLMs)花了一分鐘思考後,我們會偏愛它們的回答;但如果我們的團隊成員在會議中對我們提出的好問題之前要求花一分鐘思考,我們卻會對他們產生不滿。