マイクロソフトがHugging FaceでX-Reasonerをリリースしました テキストのみで訓練された視覚言語モデルで、推論ベンチマークでマルチモーダルSOTAを上回る性能を発揮します