Mistral vydal Mistral Small 4, model s otevřenými váhami s hybridním uvažováním a vstupem obrázků, který získal 27 bodů v indexu umělé analytické inteligence @MistralAI's Small 4 je model 119B směsi expertů s 6,5B aktivními parametry na token, podporující jak způsoby uvažování, tak neuvažování. V režimu uvažování dosahuje Mistral Small 4 27 bodů v Indexu umělé analytické inteligence, což je zlepšení o 12 bodů oproti Small 3,2 (15) a nyní patří mezi nejinteligentnější modely, které Mistral vydal, překonávající Mistral Large 3 (23) a srovnávající se s proprietárním Magistral Medium 1,2 (27). Nicméně zaostává za vrstevníky s otevřenými váhami s podobným celkovým počtem parametrů, jako jsou gpt-oss-120B (vysoký, 33), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, 36) a Qwen3.5 122B A10B (Reasoning, 42). Hlavní poznatky: ➤ Způsoby uvažování a neuvažování v jednom modelu: Mistral Small 4 podporuje konfigurovatelné hybridní uvažování s způsoby uvažování a neuvažováním, na rozdíl od samostatných variant uvažování, které Mistral dříve vydal se svými Magistrálními modely. V režimu uvažování model získává 27 bodů v Indexu umělé analytické inteligence. V režimu bez uvažování získává model skóre 19, což je zlepšení o 4 body oproti předchůdci Mistral Small 3.2 (15) ➤ Tokenově efektivnější než konkurenti podobné velikosti: Mistral Small 4 (Reasoning) používá při ~52M výstupních tokenů méně tokenů pro provoz Artificial Analysis Intelligence Index ve srovnání s modely uvažování jako gpt-oss-120B (high, ~78M), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, ~110M) a Qwen3.5 122B A10B (Reasoning, ~91M). V režimu bez uvažování model používá ~4M výstupních tokenů ➤ Nativní podpora pro vstup obrázků: Mistral Small 4 je multimodální model, který přijímá vstup obrázků i text. V našem multimodálním hodnocení MMMU-Pro dosahuje Mistral Small 4 (Reasoning) skóre 57 %, před Mistral Large 3 (56 %), ale za Qwen3.5 122B A10B (Reasoning, 75 %). Ani gpt-oss-120B, ani NVIDIA Nemotron 3 Super 120B A12B nepodporují vstup obrazu. Všechny modely podporují pouze textový výstup ➤ Zlepšení v reálných agentických úkolech: Mistral Small 4 dosahuje hodnocení Elo 871 na GDPval-AA, našem hodnocení založeném na datové sadě OpenAI GDPval, která testuje modely reálných úkolů napříč 44 profesemi a 9 hlavními odvětvími, přičemž modely produkují výstupy jako dokumenty, tabulky a diagramy v agentické smyčce. To je více než dvojnásobek Elo Small 3.2 (339) a blízko Mistral Large 3 (880), ale za gpt-oss-120B (high, 962), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, 1021) a Qwen3.5 122B A10B (Reasoning, 1130) ➤ Nižší míra halucinací než u vrstevnických modelů podobné velikosti: Mistral Small 4 skóre -30 na AA-Omniscience, našem hodnocení spolehlivosti znalostí a halucinací, kde skóre se pohybuje od -100 do 100 (čím více, tím lépe) a záporné skóre znamená více nesprávných než správných odpovědí. Mistral Small má 4 skóre před gpt-oss-120B (vysoký, -50), Qwen3.5 122B A10B (Uvažování, -40) a NVIDIA Nemotron 3 Super 120B A12B (Uvažování, -42) Klíčové údaje o modelu: ➤ Kontextové okno: 256K tokenů (oproti 128K u Small 3.2) ➤ Ceny: 0,15 $/0,6 $ za 1 milion vstupních/výstupních tokenů ➤ Dostupnost: Mistral pouze pro první strany. Při nativní přesnosti FP8 vyžadují parametry Mistral Small 4 119B ~119GB pro samostatné hostování váh (více než 80GB paměti HBM3 na jednom NVIDIA H100) ➤ Modalita: Vstup obrázků a textu pouze s textovým výstupem ➤ Licencování: Licence Apache 2.0
Co se týče inteligence vs celkový parametr, Mistral Small 4 (Uvažování, 27) nabízí méně výhodný kompromis než konkurenti podobných velikostí, jako jsou GPT-OSS-120B (vysoký, 33), NVIDIA Nemotron 3 Super 120B A12B (Uvažování, 36) a Qwen3.5 122B A10B (Uvažování, 42)
Mistral Small 4 (Reasoning) používá při ~52M výstupních tokenech méně tokenů pro provoz Artificial Analysis Intelligence Index ve srovnání s rovnocennými modely jako gpt-oss-120B (high, ~78M), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, ~110M) a Qwen3.5 122B A10B (Reasoning, ~91M)
Kompletní rozpis výsledků:
Kompletní výsledky jsou dostupné na stránce modelu Mistral Small 4 o umělé analýze:
8,42K