Microsoft membunuh mafia 🤯 GPU Mereka akhirnya membuka kerangka kerja inferensi LLM 1-bit mereka yang disebut bitnet.cpp. Ini memungkinkan Anda menjalankan model parameter 100B pada CPU lokal Anda tanpa GPU. - Inferensi 6,17x lebih cepat - 82,2% lebih sedikit energi pada CPU 100% Sumber Terbuka.