4つの高レベルOpenCodeエージェント+サブエージェントをmlx_lm.server連続バッチ処理とMiniMax M2.5(6ビット)で実行しています。 512GB M3 Ultraに簡単に収まります。生成はかなり速いです。しかし、プリフィルはクラウドサーバーと比べると依然として遅いです。