O primeiro lançamento do mlx-lm em 2026 está recheado: pip install -U mlx-lm - Um monte de novos modelos (h/t @kernelpool, @JohnMai_Dev) - Suporte muito melhor para chamadas de ferramentas e raciocínio em mlx_lm.server - Suporte para quantização mxfp8 e nvfp4 (requer mlx em pré-lançamento)