MLX : nouveau modèle Arcee AI Trinity Mini fonctionnant sur M3 Ultra 512 en 4 bits ! 112 tokens/sec ! 🔥 mlx_lm.generate --model ~/Trinity-Mini-4bit --prompt "Écris un poème sur les LLMs" -m 2048 PR prêt, modèles sur mlx-community 🚀