Not: RDMA destekleyen birden fazla Macbook'unuz varsa, onları @exolabs ile kümeleyip 30B+ modelleri 70 tok/s hızda çalıştırabilirsiniz, Thunderbolt5 üzerinden. Tüketici donanımında tensör paralelliği çözülmüş bir sorundur. kanepenizdeki dizüstü bilgisayardan daha kötü GPU'ları kiralaıyorsunuz. 2X M4 Max (her biri 64GB) mlx-community/Qwen3-30B-A3B-4bit @ 70 TPS çalıştırıyor