Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Mistral vydal Mistral Small 4, model s otevřenými váhami s hybridním uvažováním a vstupem obrázků, který získal 27 bodů v indexu umělé analytické inteligence
@MistralAI's Small 4 je model 119B směsi expertů s 6,5B aktivními parametry na token, podporující jak způsoby uvažování, tak neuvažování.
V režimu uvažování dosahuje Mistral Small 4 27 bodů v Indexu umělé analytické inteligence, což je zlepšení o 12 bodů oproti Small 3,2 (15) a nyní patří mezi nejinteligentnější modely, které Mistral vydal, překonávající Mistral Large 3 (23) a srovnávající se s proprietárním Magistral Medium 1,2 (27). Nicméně zaostává za vrstevníky s otevřenými váhami s podobným celkovým počtem parametrů, jako jsou gpt-oss-120B (vysoký, 33), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, 36) a Qwen3.5 122B A10B (Reasoning, 42).
Hlavní poznatky:
➤ Způsoby uvažování a neuvažování v jednom modelu: Mistral Small 4 podporuje konfigurovatelné hybridní uvažování s způsoby uvažování a neuvažováním, na rozdíl od samostatných variant uvažování, které Mistral dříve vydal se svými Magistrálními modely. V režimu uvažování model získává 27 bodů v Indexu umělé analytické inteligence. V režimu bez uvažování získává model skóre 19, což je zlepšení o 4 body oproti předchůdci Mistral Small 3.2 (15)
➤ Tokenově efektivnější než konkurenti podobné velikosti: Mistral Small 4 (Reasoning) používá při ~52M výstupních tokenů méně tokenů pro provoz Artificial Analysis Intelligence Index ve srovnání s modely uvažování jako gpt-oss-120B (high, ~78M), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, ~110M) a Qwen3.5 122B A10B (Reasoning, ~91M). V režimu bez uvažování model používá ~4M výstupních tokenů
➤ Nativní podpora pro vstup obrázků: Mistral Small 4 je multimodální model, který přijímá vstup obrázků i text. V našem multimodálním hodnocení MMMU-Pro dosahuje Mistral Small 4 (Reasoning) skóre 57 %, před Mistral Large 3 (56 %), ale za Qwen3.5 122B A10B (Reasoning, 75 %). Ani gpt-oss-120B, ani NVIDIA Nemotron 3 Super 120B A12B nepodporují vstup obrazu. Všechny modely podporují pouze textový výstup
➤ Zlepšení v reálných agentických úkolech: Mistral Small 4 dosahuje hodnocení Elo 871 na GDPval-AA, našem hodnocení založeném na datové sadě OpenAI GDPval, která testuje modely reálných úkolů napříč 44 profesemi a 9 hlavními odvětvími, přičemž modely produkují výstupy jako dokumenty, tabulky a diagramy v agentické smyčce. To je více než dvojnásobek Elo Small 3.2 (339) a blízko Mistral Large 3 (880), ale za gpt-oss-120B (high, 962), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, 1021) a Qwen3.5 122B A10B (Reasoning, 1130)
➤ Nižší míra halucinací než u vrstevnických modelů podobné velikosti: Mistral Small 4 skóre -30 na AA-Omniscience, našem hodnocení spolehlivosti znalostí a halucinací, kde skóre se pohybuje od -100 do 100 (čím více, tím lépe) a záporné skóre znamená více nesprávných než správných odpovědí. Mistral Small má 4 skóre před gpt-oss-120B (vysoký, -50), Qwen3.5 122B A10B (Uvažování, -40) a NVIDIA Nemotron 3 Super 120B A12B (Uvažování, -42)
Klíčové údaje o modelu:
➤ Kontextové okno: 256K tokenů (oproti 128K u Small 3.2)
➤ Ceny: 0,15 $/0,6 $ za 1 milion vstupních/výstupních tokenů
➤ Dostupnost: Mistral pouze pro první strany. Při nativní přesnosti FP8 vyžadují parametry Mistral Small 4 119B ~119GB pro samostatné hostování váh (více než 80GB paměti HBM3 na jednom NVIDIA H100)
➤ Modalita: Vstup obrázků a textu pouze s textovým výstupem
➤ Licencování: Licence Apache 2.0

Co se týče inteligence vs celkový parametr, Mistral Small 4 (Uvažování, 27) nabízí méně výhodný kompromis než konkurenti podobných velikostí, jako jsou GPT-OSS-120B (vysoký, 33), NVIDIA Nemotron 3 Super 120B A12B (Uvažování, 36) a Qwen3.5 122B A10B (Uvažování, 42)

Mistral Small 4 (Reasoning) používá při ~52M výstupních tokenech méně tokenů pro provoz Artificial Analysis Intelligence Index ve srovnání s rovnocennými modely jako gpt-oss-120B (high, ~78M), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, ~110M) a Qwen3.5 122B A10B (Reasoning, ~91M)

Kompletní rozpis výsledků:

Kompletní výsledky jsou dostupné na stránce modelu Mistral Small 4 o umělé analýze:
8,42K
Top
Hodnocení
Oblíbené
