Minimax M2.1(@MiniMax__AI)をOpenCode(@opencode)とmlx_lm.serverで運用しています。 M3ウルトラでもかなりうまく動作します。KVキャッシュが温まると、プロンプト処理はかなり速くなります。そしてトークン生成は非常に速いです。