Microsoft acaba de lanzar X-Reasoner sobre Hugging Face Un modelo de visión y lenguaje entrenado *solo en texto* que supera a la SOTA multimodal en benchmarks de razonamiento