Executando quatro agentes OpenCode de alto nível + subagentes com batching contínuo mlx_lm.server e MiniMax M2.5 (6-bit). Cabe facilmente em um M3 Ultra de 512GB. A geração é bastante rápida. Mas o preenchimento ainda é lento em comparação com servidores em nuvem.