Microsoft vient de publier X-Reasoner sur Hugging Face Un modèle de vision-langage entraîné *uniquement sur du texte* qui surpasse le SOTA multimodal sur les benchmarks de raisonnement