Eseguire quattro agenti OpenCode di alto livello + subagenti con batching continuo mlx_lm.server e MiniMax M2.5 (6-bit). Si adatta facilmente a un M3 Ultra da 512GB. La generazione è piuttosto veloce. Ma il prefill è ancora lento rispetto ai server cloud.