Rodando quatro agentes OpenCode de alto nível + subagentes com batching contínuo mlx_lm.server e MiniMax M2.5 (6 bits). Cabe facilmente em um M3 Ultra de 512GB. A geração é bem rápida. Mas o preenchimento ainda é lento comparado aos servidores na nuvem.