GLM-4.7-8bit (350 Go) fonctionnant à 19 toks/s sur deux M3 Ultra 512 Go utilisant le parallélisme tensoriel avec EXO - MLX, contre 14 toks/s avec un seul nœud. 🚀 Maintenant, benchmarking du contexte & puis tests OpenCode 🔥 Remarque : ceci provient de sources, j'ai dû modifier des éléments pour le faire fonctionner.