Na minha experiência, Grok e ChatGPT 5.2 são muito mais rígidos e menos propensos a cair na alucinação de um usuário sobre um fato – enquanto Claude 4.5 opus basicamente só concorda cegamente com qualquer refutação