MLX-LM håller på att bli ett ganska kraftfullt litet inferensramverk! Den senaste versionen lägger till tensor-parallell LLM-inferens för användning med den nya låglatens JACCL-backend i MLX (h/t @angeloskath). Uppdaterade också för att stödja Transformers V5!