MLX-LM se stává opravdu silným malým rámcem pro inference! Nejnovější verze přidává tenzor-paralelní inferenci LLM pro použití s novým nízkolatencním JACCL back-endem v MLX (h/t @angeloskath). Také aktualizováno na podporu Transformers V5!