MLX: neues Arcee AI Trinity Mini Modell, das auf M3 Ultra 512 in 4bit läuft! 112 Tokens/Sekunde! 🔥 mlx_lm.generate --model ~/Trinity-Mini-4bit --prompt "Schreibe ein Gedicht über LLMs" -m 2048 PR bereit, Modelle auf mlx-community 🚀