Microsoft a tué la mafia des GPU 🤯 Ils ont enfin rendu open source leur framework d'inférence LLM 1-bit appelé bitnet.cpp. Cela vous permet d'exécuter des modèles de 100 milliards de paramètres sur votre CPU local sans GPU. - Inférence 6,17x plus rapide - 82,2 % d'énergie en moins sur les CPU 100 % Open Source.