根据我的经验,Grok 和 ChatGPT 5.2 更加严格,不太可能被用户的事实幻觉所迷惑,而 Claude 4.5 opus 则基本上会盲目同意任何反驳。