PSA: Als je meerdere MacBooks hebt die RDMA ondersteunen, kun je ze clusteren met @exolabs en 30B+ modellen draaien met 70 tok/s via Thunderbolt 5. Tensor parallelisme op consumentenhardware is een opgelost probleem. Je huurt GPU's die slechter zijn dan de laptop op je bank. 2X M4 Max (64GB elk) die mlx-community/Qwen3-30B-A3B-4bit draaien @ 70 TPS