MLX: nieuw Arcee AI Trinity Mini model draait op M3 Ultra 512 in 4bit! 112 tokens/sec! 🔥 mlx_lm.generate --model ~/Trinity-Mini-4bit --prompt "Schrijf een gedicht over LLM's" -m 2048 PR klaar, modellen op mlx-community 🚀