PSA: Если у вас есть несколько MacBook, которые поддерживают RDMA, вы можете объединить их в кластер с помощью @exolabs и запускать модели 30B+ со скоростью 70 ток/с по Thunderbolt 5. Тензорный параллелизм на потребительском оборудовании — это решенная проблема. Вы арендуете GPU, которые хуже, чем ноутбук на вашем диване. 2X M4 Max (по 64 ГБ каждый) работают с mlx-community/Qwen3-30B-A3B-4bit со скоростью 70 TPS