GLM-4.6Vが急に下がった。 - 推論+ビジョン、さらにネイティブツール呼び出し。 - 2つのサイズ:10Bフラッシュと108B。 - 128Kのコンテキスト。 トランス + vLLM 準備 🤗🔥