Vier hochrangige OpenCode-Agenten + Subagenten mit mlx_lm.server kontinuierlichem Batching und MiniMax M2.5 (6-Bit) laufen. Passt problemlos auf einen 512GB M3 Ultra. Die Generierung ist ziemlich schnell. Aber das Prefill ist im Vergleich zu Cloud-Servern immer noch langsam.