Microsoft zlikvidoval GPU mafii 🤯 Nakonec otevřeli svůj 1bitový LLM inferenční framework nazvaný bitnet.cpp. Umožňuje vám spustit modely s parametry 100B na lokálním CPU bez GPU. - 6,17x rychlejší inference - 82,2 % méně energie na CPU 100% open source.