El GLM-4.7 funciona bastante bien en un M3 Ultra con mlx-lm, incluso con una precisión casi sin pérdidas (aquí 6 bits). Generó el mejor juego de Space Invaders que he visto hasta ahora para un modelo local (¡incluso incluyó efectos de sonido!). Generé 6600 tokens y funcionó a 16 tok/s.
Z.ai
Z.ai23 dic, 01:30
¡GLM-4.7 está aquí! GLM-4.7 supera a GLM-4.6 con mejoras sustanciales en codificación, razonamiento complejo y uso de herramientas, estableciendo nuevos estándares SOTA de código abierto. También mejora el rendimiento en chat, escritura creativa y escenarios de rol. Modelo predeterminado para el plan de codificación: Pruébalo ahora: Pesos: Blog tecnológico:
Aquí tienes una grabación de pantalla del juego y el comando utilizado para generarlo: ``` mlx_lm.generate --model mlx-community/GLM-4.7-6bit --prompt "Escribe una página HTML y JavaScript implementando invasores de espacio" -m 8192 ```
972