MLX:新的 Arcee AI Trinity Mini 模型在 M3 Ultra 512 上以 4bit 運行! 112 個標記/秒!🔥 mlx_lm.generate --model ~/Trinity-Mini-4bit --prompt "寫一首關於 LLM 的詩" -m 2048 PR 準備好,模型在 mlx-community 🚀