Microsoft har nettopp lansert X-Reasoner på Hugging Face En visjonsspråkmodell trent *kun på tekst* som overgår multimodal SOTA på resonnementsbenchmarks