Başardım! İşe yarıyor! GLM-4.7-4bit ile mlx_lm.server ve opencode ile gerçek kodu yerel olarak düzeltmek için kullanıyorum! 🔥 Burada tek M3 Ultra 512GB, yeni step fazı Tensor Paralelliği ile 2 olacak ve ardından aynı değişiklikleri exo'ya uygulayacak. Tek bir makinede ön doldurma yavaş ama üretim iyidir.