Det är möjligt att träna modeller i vilken storlek som helst med Mac. Pipeline-parallellism möjliggör detta – att lägga en del av modellen på varje enhet. Att implementera detta med MLX på Apple Silicon var en stor utmaning; Jag har skrivit ett blogginlägg där jag beskriver hur det fungerar. 🧵