Meğerse Mac donanımında devasa Comp-of-Experts çalıştırabilirsiniz, tüm modeli RAM'e sığdırmadan ise, her oluşturulan token için SSD'den uzman ağırlıklarının bir alt kümesini akış yaparak - ve insanlar daha büyük modelleri çalıştırmanın yollarını bulmaya devam ediyor Kimi 2.5 1T ama sadece 32B aktif, yani 96GB sığıyor