Het is mogelijk om modellen van elke grootte te trainen met Macs. Pipeline-parallelisme maakt dit mogelijk - een deel van het model op elk apparaat plaatsen. Dit implementeren met MLX op Apple Silicon was een behoorlijke uitdaging; ik heb een blogpost geschreven waarin ik uitleg hoe het werkt. 🧵