Microsoft только что выпустила X-Reasoner на Hugging Face Модель визуального языка, обученная *только на тексте*, которая превосходит мультимодальные SOTA по показателям рассуждений