Jemand hat gerade vier hochrangige OpenCode-Agenten + Unteragenten mit mlx_lm.server kontinuierlichem Batching und MiniMax M2.5 (6-Bit) ausgeführt. Passt auf einen 512GB M3 Ultra. Die Generierung ist schnell, aber das Vorabfüllen ist im Vergleich zu Cloud-Servern immer noch langsam. Lokale Agentenschwärme werden praktikabel.