MLX: novo modelo Arcee AI Trinity Mini a correr no M3 Ultra 512 em 4bit! 112 tokens/segundo! 🔥 mlx_lm.generate --model ~/Trinity-Mini-4bit --prompt "Escreve um poema sobre LLMs" -m 2048 PR pronto, modelos na mlx-community 🚀