Ejecutando cuatro agentes OpenCode de alto nivel + subagentes con mlx_lm.server procesamiento continuo y MiniMax M2.5 (6 bits). Se adapta fácilmente a un M3 Ultra de 512GB. La generación es bastante rápida. Pero el prellenado sigue siendo lento en comparación con los servidores en la nube.