Microsoft acaba de lanzar X-Reasoner en Hugging Face Un modelo de visión-lenguaje entrenado *solo con texto* que supera el SOTA multimodal en los benchmarks de razonamiento