GLM-4.7 działa całkiem dobrze na M3 Ultra z mlx-lm, nawet przy niemal bezstratnej precyzji (6-bit tutaj). Wygenerował najlepszą grę w Space Invaders, jaką do tej pory widziałem dla lokalnego modelu (nawet z efektami dźwiękowymi!). Wygenerowano 6600 tokenów i działał z prędkością 16 tok/s.
Z.ai
Z.ai23 gru, 01:30
GLM-4.7 jest tutaj! GLM-4.7 przewyższa GLM-4.6 dzięki znacznym ulepszeniom w kodowaniu, złożonym rozumowaniu i używaniu narzędzi, ustanawiając nowe standardy SOTA w otwartym kodzie źródłowym. Zwiększa również wydajność w czatach, twórczym pisaniu i scenariuszach odgrywania ról. Domyślny model dla planu kodowania: Wypróbuj to teraz: Wagi: Blog technologiczny:
Oto nagranie ekranu z gry oraz polecenie użyte do jego wygenerowania: ``` mlx_lm.generate --model mlx-community/GLM-4.7-6bit --prompt "Napisz stronę HTML i JavaScript implementującą space invaders" -m 8192 ```
866