Exécution de quatre agents OpenCode de haut niveau + sous-agents avec le traitement par lots continu mlx_lm.server et MiniMax M2.5 (6 bits). S'adapte facilement sur un M3 Ultra de 512 Go. La génération est assez rapide. Mais le pré-remplissage est toujours lent par rapport aux serveurs cloud.