Microsoft właśnie wydał X-Reasoner na Hugging Face Model wizji i języka wytrenowany *tylko na tekście*, który przewyższa multimodalne SOTA w benchmarkach rozumowania