MLX: mô hình Arcee AI Trinity Mini mới chạy trên M3 Ultra 512 ở chế độ 4bit! 112 token/giây! 🔥 mlx_lm.generate --model ~/Trinity-Mini-4bit --prompt "Viết một bài thơ về LLMs" -m 2048 Sẵn sàng PR, các mô hình trên mlx-community 🚀