GLM-4.7-8bit (350GB) działający z prędkością 19 toks/s na dwóch M3 Ultra 512GB z użyciem Tensor Parallelism z EXO - MLX, w porównaniu do 14 toks/s z pojedynczym węzłem. 🚀 Teraz testowanie kontekstu & następnie testy OpenCode 🔥 Uwaga: to pochodzi ze źródeł, musiałem zmienić rzeczy, aby to uruchomić.