🚀 Podpora pro den 0: Kimi K2 Thinking nyní běží na vLLM! Jsme hrdí na to, že ve spolupráci se společností @Kimi_Moonshot můžeme poskytovat oficiální podporu pro nejmodernější model otevřeného myšlení s parametry 1T, 32B aktivními. Snadné nasazení ve vLLM (noční verze) s rozhraním API kompatibilním s OpenAI: Čím je výjimečný: ⚡ Nativní kvantizace INT4 → 2× rychlejší odvozování 💾 Poloviční nároky na paměť, žádná ztráta přesnosti 🎯 256 tisíc kontextů, stabilní napříč 200-300 voláními nástrojů 🎯 Včetně oficiálního receptu a průvodce nasazením Prvotřídní uvažování, které je nyní dostupné každému. 📦 Model: 📚 Recepty: #vLLM #KimiK2 #LLMInference