Pozoruhodný. Zase Čína...
Artificial Analysis
Artificial Analysis7. 11. 05:10
Společnost MoonshotAI vydala Kimi K2 Thinking, novou variantu uvažování Kimi K2, která dosahuje #1 v agentickém benchmarku Tau2 Bench Telecom a je potenciálně novým vedoucím modelem otevřených vah Kimi K2 Thinking je jedním z největších modelů s otevřenou váhou vůbec, při celkových parametrech 1T s 32B aktivními. K2 Thinking je první verze modelu Kimi K2 od společnosti @Kimi_Moonshot, která následuje po modelech Kimi K2 Instruct bez uvažování, které byly vydány dříve v červenci a září 2025. Klíčové poznatky: ➤ Silný výkon v agentských úkolech: Kimi K2 Thinking dosahuje 93 % v τ²-Bench Telecom, benchmarku použití agentských nástrojů, kde model funguje jako agent zákaznického servisu. Jedná se o nejvyšší skóre, které jsme nezávisle naměřili. Použití nástrojů v agentských kontextech s dlouhým horizontem bylo silnou stránkou Kimi K2 Instruct a zdá se, že tato nová varianta myšlení přináší značné výhody ➤ Varianta uvažování Kimi K2 Instruct: Model je podle svého pojmenování variantou uvažování Kimi K2 Instruct. Model má stejnou architekturu a stejný počet parametrů (i když jinou přesnost) jako Kimi K2 Instruct a stejně jako K2 Instruct podporuje pouze text jako vstupní (a výstupní) modalitu ➤ Parametry 1T, ale INT4 místo FP8: Na rozdíl od předchozích vydání Kimi K2 Instruct od Moonshotu, která používala přesnost FP8, byl tento model vydán nativně v přesnosti INT4. Moonshot k dosažení tohoto cíle využil školení zaměřené na kvantizaci ve fázi po tréninku. Důsledkem toho je, že K2 Thinking má pouze ~594 GB ve srovnání s něco málo přes 1 TB u K2 Instruct a K2 Instruct 0905 - což se promítá do zvýšení efektivity při odvozování a tréninku. Potenciálním důvodem pro INT4 je to, že GPU NVIDIA před Blackwellem nemají podporu pro FP4, takže INT4 je vhodnější pro dosažení zvýšení efektivity na dřívějším hardwaru. Naše kompletní sada srovnávacích testů indexu umělé inteligence probíhá a jakmile budou dokončeny, poskytneme vám aktualizaci.
Hlavní investoři v @Kimi_Moonshot : Alibaba (40% vlastník), Tencent, Meituan, Ant Group, Hongshan ... a Microsoft se zúčastnil!
3,56K