En mi experiencia, Grok y ChatGPT 5.2 son mucho más rígidos y menos propensos a caer en la alucinación de un usuario sobre un hecho, mientras que Claude 4.5 opus básicamente acepta ciegamente cualquier refutación