Microsoft baru saja merilis X-Reasoner di Hugging Face Model bahasa visi yang dilatih *hanya pada teks* yang mengungguli SOTA multimodal pada tolok ukur penalaran