DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Mistral ha appena lanciato il suo nuovo modello di pesi aperti di grandi dimensioni, Mistral Large 3 (675B totali, 41B attivi), insieme a un insieme di tre modelli Ministral (3B, 8B, 14B) Mistral ha rilasciato varianti Instruct (non di ragionamento) di tutti e quattro i modelli, così come varianti di ragionamento dei tre modelli Ministral. Tutti i modelli supportano input multimodali e sono disponibili con una licenza Apache 2.0 oggi su @huggingface. Abbiamo valutato Mistral Large 3 e le varianti Instruct dei tre modelli Ministral prima del lancio. Il modello con il punteggio più alto di Mistral nell'Artificial Analysis Intelligence Index rimane il proprietario Magistral Medium 1.2, lanciato un paio di mesi fa a settembre - questo è dovuto al fatto che il ragionamento conferisce ai modelli un vantaggio significativo in molte valutazioni che utilizziamo. Mistral comunica che una versione di ragionamento di Mistral Large 3 è già in fase di addestramento e non vediamo l'ora di valutarla presto! Punti salienti: ➤ Modelli grandi e piccoli: con 675B totali e 41B attivi, Mistral Large 3 è il primo modello a pesi aperti a miscela di esperti di Mistral da Mixtral 8x7B e 8x22B alla fine del 2023 all'inizio del 2024. I rilasci di Ministral sono densi con varianti di parametri 3B, 8B e 14B ➤ Aumento significativo dell'intelligenza ma non tra i modelli leader (inclusi quelli proprietari): Mistral Large 3 rappresenta un significativo aggiornamento rispetto al precedente Mistral Large 2 con un aumento di +11 punti sull'Intelligence Index fino a 38. Tuttavia, Large 3 è ancora indietro rispetto ai modelli di ragionamento e non di ragionamento proprietari leader ➤ Modelli piccoli versatili: i modelli Ministral sono rilasciati con pesi varianti Base, Instruct e Reasoning - abbiamo testato solo le varianti Instruct prima del rilascio, che hanno ottenuto punteggi dell'Index di 31 (14B), 28 (8B) e 22 (3B). Questo colloca il Ministral 14B davanti al precedente Mistral Small 3.2 con il 40% in meno di parametri. Stiamo lavorando per valutare le varianti di ragionamento e condivideremo presto i loro risultati di intelligenza. ➤ Capacità multi-modali: tutti i modelli nel rilascio supportano input di testo e immagine - questo è un differenziatore significativo per Mistral Large 3, poiché pochi modelli a pesi aperti nella sua classe di dimensioni supportano input di immagine. La lunghezza del contesto aumenta anche a 256k, consentendo compiti di input più grandi. Questi nuovi modelli di Mistral non rappresentano un cambiamento radicale rispetto alla concorrenza a pesi aperti, ma rappresentano una solida base di prestazioni con capacità visive. Le varianti 8B e 14B di Ministral offrono prestazioni particolarmente interessanti per le loro dimensioni, e siamo entusiasti di vedere come la comunità utilizza e costruisce su questi modelli. Al lancio, i nuovi modelli sono disponibili per inferenza senza server su @MistralAI e una serie di altri fornitori tra cui @awscloud Bedrock, @Azure AI Foundry, @IBMwatsonx, @FireworksAI_HQ, @togethercompute e @modal.

Mistral Large 3 è all'avanguardia, ma è notevole che sia uno dei modelli multimodali a pesi aperti più intelligenti senza ragionamento. I modelli recenti di DeepSeek (v3.2) e Moonshot (Kimi K2) continuano a supportare solo input e output testuali.

A causa delle loro dimensioni ridotte, i rilasci di Ministral mostrano un solido rapporto intelligenza-costo, completando le valutazioni dell'Indice a un costo sostanzialmente inferiore rispetto a modelli comparabili come i modelli piccoli della famiglia Qwen3 - in particolare le varianti VL che supportano input di immagini come Ministral.

I modelli Ministral sono particolarmente differenziati per compiti che richiedono input di immagini e un modello non di ragionamento. Tutte e tre le dimensioni rappresentano un significativo miglioramento rispetto alla famiglia Gemma 3 di Google (precedentemente un'opzione di riferimento per modelli multimodali di piccole dimensioni) e sono competitivi con i recenti rilasci Qwen3 VL di Alibaba.

Magistral Medium 1.2 rimane il modello principale di Mistral nell'Indice di Intelligenza Artificiale Analitica.

Per ulteriori analisi di questi nuovi modelli e dei fornitori per essi man mano che emergono, consulta le nostre pagine modello su Artificial Analysis: Mistral Large 3: Ministral 14B: Ministral 8B:

8,15K

Principali

Ranking

Preferiti