一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

Mistral 剛剛推出了他們的新大型開放權重模型 Mistral Large 3（總計 675B，活躍 41B），以及一組三個 Ministral 模型（3B、8B、14B） Mistral 已經發布了所有四個模型的 Instruct（非推理）變體，以及三個 Ministral 模型的推理變體。所有模型都支持多模態輸入，並且今天在 @huggingface 上以 Apache 2.0 許可證提供。我們在發布之前評估了 Mistral Large 3 和三個 Ministral 模型的 Instruct 變體。 Mistral 在人工分析智能指數中得分最高的模型仍然是專有的 Magistral Medium 1.2，該模型在幾個月前的九月推出 - 這是因為推理在我們使用的許多評估中給模型帶來了顯著的優勢。Mistral 披露 Mistral Large 3 的推理版本已經在訓練中，我們期待著很快對其進行評估！主要亮點： ➤ 大型和小型模型：Mistral Large 3 總計 675B，活躍 41B，是 Mistral 自 2023 年底至 2024 年初 Mixtral 8x7B 和 8x22B 以來的第一個開放權重專家混合模型。Ministral 發布的模型密集，具有 3B、8B 和 14B 參數變體 ➤ 顯著的智能增長，但不在領先模型之中（包括專有模型）：Mistral Large 3 相較於之前的 Mistral Large 2 代表了一次顯著的升級，智力指數提高了 11 分，達到 38。然而，Large 3 仍然落後於領先的專有推理和非推理模型 ➤ 多功能的小型模型：Ministral 模型以 Base、Instruct 和 Reasoning 變體權重發布 - 我們在發布前僅測試了 Instruct 變體，這些變體的指數得分為 31（14B）、28（8B）和 22（3B）。這使得 Ministral 14B 超越了之前的 Mistral Small 3.2，參數少了 40%。我們正在評估推理變體，並將很快分享它們的智能結果。 ➤ 多模態能力：發布中的所有模型都支持文本和圖像輸入 - 這對於 Mistral Large 3 來說是一個顯著的區別，因為在其大小類別中，少數開放權重模型支持圖像輸入。上下文長度也增加到 256k，使得更大的輸入任務成為可能。這些來自 Mistral 的新模型並不是開放權重競爭中的一個重大變化，但它們代表了一個強大的性能基礎，具備視覺能力。Ministral 8B 和 14B 變體在其大小上提供了特別引人注目的性能，我們期待看到社區如何使用和基於這些模型進行構建。在發布時，這些新模型可在 @MistralAI 和包括 @awscloud Bedrock、@Azure AI Foundry、@IBMwatsonx、@FireworksAI_HQ、@togethercompute 和 @modal 在內的多個其他提供商上進行無伺服器推理。

Mistral Large 3 在前沿技術中落後，但顯著的是它是最智能的開放權重多模態非推理模型之一。DeepSeek（v3.2）和 Moonshot（Kimi K2）最近的模型仍然僅支持文本輸入和輸出。

由於其小巧的尺寸，Ministral 發布的模型在智能與成本之間展現出良好的平衡，以顯著低於可比模型（如 Qwen3 系列的小型模型，特別是支持圖像輸入的 VL 變體）的成本完成指數評估。

Ministral 模型特別針對需要圖像輸入和非推理模型的任務進行了區分。這三種尺寸都是對 Google 的 Gemma 3 系列（之前是小型多模態模型的首選選項）的重大升級，並且與阿里巴巴最近的 Qwen3 VL 發布具有競爭力。

Magistral Medium 1.2 仍然是 Mistral 在人工分析智能指數中的整體領先模型。

有關這些新模型及其提供者的進一步分析，請參閱我們在人工分析上的模型頁面： Mistral Large 3： Ministral 14B： Ministral 8B：

8.14K