Я это сделал! Это работает! Используя GLM-4.7-4bit с mlx_lm.server и opencode для исправления реального кода локально! 🔥 Вот один M3 Ultra 512GB, следующий этап будет 2, используя тензорный параллелизм, а затем применим те же изменения к exo. Предварительная загрузка медленная на одной машине, но генерация хорошая.