Minä tein sen! Se toimii! Käytän GLM-4.7-4bittiä mlx_lm.serverin ja opencoden kanssa oikean koodin paikalliseen korjaamiseen! 🔥 Tässä yksittäisessä M3 Ultra 512GB:ssa, nex step phase on 2 Tensor Parallelismin avulla ja sitten sovelletaan samat muutokset exoon. Esitäyttö on hidasta yhdellä koneella, mutta generointi on hyvä.