Qwen3.5 mlx-lm'de oldukça iyi çalışıyor. Sınır seviyesinde bir hibrit modelimiz olması harika. Bağlam uzamak için ayrılıyor ama çıkarım hızı ve bellek kullanımı neredeyse hiç değişmiyor. İşte Q4'ün M3 Ultra ile bir space invaders oyunu oluşturduğu sahne. 4.120 token üretti, 37.6 tok/s hızında.
Dönüşüm için @pcuenq'ye teşekkürler. Ve liman için @JJJYmmm2002, @ActuallyIsaak ve @JohnMai_Dev.
90