Na minha experiência, o Grok e o ChatGPT 5.2 são muito mais rígidos e menos propensos a cair na alucinação de um usuário sobre um fato - enquanto o Claude 4.5 opus basicamente concordará cegamente com qualquer refutação.