MLX: novo modelo Arcee AI Trinity Mini rodando no M3 Ultra 512 em 4 bits! 112 tokens/seg! 🔥 mlx_lm.generate --model ~/Trinity-Mini-4bit --prompt "Escreva um poema em LLMs" -m 2048 PR prontos, modelos no mlx-community 🚀