mlx-lm становится довольно мощным небольшим фреймворком для вывода! Последний релиз добавляет тензорный параллельный вывод LLM для использования с новым бэкендом JACCL с низкой задержкой в MLX (спасибо @angeloskath). Также обновлено для поддержки Transformers V5!