MLX:新的 Arcee AI Trinity Mini 模型在 M3 Ultra 512 上以 4bit 运行! 112 个令牌/秒!🔥 mlx_lm.generate --model ~/Trinity-Mini-4bit --prompt "写一首关于 LLM 的诗" -m 2048 PR 准备就绪,模型在 mlx-community 上 🚀