MLX-LM стає досить потужним маленьким фреймворком для висновків! Останній реліз додає тензорно-паралельне LLM-виведення для використання з новим низькозатримковим JACCL бекендом у MLX (h/t @angeloskath). Також оновлено для підтримки Transformers V5!