Rulând patru agenți OpenCode de nivel înalt + subagenți cu mlx_lm.server continuous batching și MiniMax M2.5 (6 biți). Se potrivește ușor pe un M3 Ultra de 512GB. Generarea este destul de rapidă. Dar preumplerea este tot lentă comparativ cu serverele cloud.