熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
Mistral 剛剛推出了他們的新大型開放權重模型 Mistral Large 3(總計 675B,活躍 41B),以及一組三個 Ministral 模型(3B、8B、14B)
Mistral 已經發布了所有四個模型的 Instruct(非推理)變體,以及三個 Ministral 模型的推理變體。所有模型都支持多模態輸入,並且今天在 @huggingface 上以 Apache 2.0 許可證提供。我們在發布之前評估了 Mistral Large 3 和三個 Ministral 模型的 Instruct 變體。
Mistral 在人工分析智能指數中得分最高的模型仍然是專有的 Magistral Medium 1.2,該模型在幾個月前的九月推出 - 這是因為推理在我們使用的許多評估中給模型帶來了顯著的優勢。Mistral 披露 Mistral Large 3 的推理版本已經在訓練中,我們期待著很快對其進行評估!
主要亮點:
➤ 大型和小型模型:Mistral Large 3 總計 675B,活躍 41B,是 Mistral 自 2023 年底至 2024 年初 Mixtral 8x7B 和 8x22B 以來的第一個開放權重專家混合模型。Ministral 發布的模型密集,具有 3B、8B 和 14B 參數變體
➤ 顯著的智能增長,但不在領先模型之中(包括專有模型):Mistral Large 3 相較於之前的 Mistral Large 2 代表了一次顯著的升級,智力指數提高了 11 分,達到 38。然而,Large 3 仍然落後於領先的專有推理和非推理模型
➤ 多功能的小型模型:Ministral 模型以 Base、Instruct 和 Reasoning 變體權重發布 - 我們在發布前僅測試了 Instruct 變體,這些變體的指數得分為 31(14B)、28(8B)和 22(3B)。這使得 Ministral 14B 超越了之前的 Mistral Small 3.2,參數少了 40%。我們正在評估推理變體,並將很快分享它們的智能結果。
➤ 多模態能力:發布中的所有模型都支持文本和圖像輸入 - 這對於 Mistral Large 3 來說是一個顯著的區別,因為在其大小類別中,少數開放權重模型支持圖像輸入。上下文長度也增加到 256k,使得更大的輸入任務成為可能。
這些來自 Mistral 的新模型並不是開放權重競爭中的一個重大變化,但它們代表了一個強大的性能基礎,具備視覺能力。Ministral 8B 和 14B 變體在其大小上提供了特別引人注目的性能,我們期待看到社區如何使用和基於這些模型進行構建。
在發布時,這些新模型可在 @MistralAI 和包括 @awscloud Bedrock、@Azure AI Foundry、@IBMwatsonx、@FireworksAI_HQ、@togethercompute 和 @modal 在內的多個其他提供商上進行無伺服器推理。

Mistral Large 3 在前沿技術中落後,但顯著的是它是最智能的開放權重多模態非推理模型之一。DeepSeek(v3.2)和 Moonshot(Kimi K2)最近的模型仍然僅支持文本輸入和輸出。

由於其小巧的尺寸,Ministral 發布的模型在智能與成本之間展現出良好的平衡,以顯著低於可比模型(如 Qwen3 系列的小型模型,特別是支持圖像輸入的 VL 變體)的成本完成指數評估。

Ministral 模型特別針對需要圖像輸入和非推理模型的任務進行了區分。這三種尺寸都是對 Google 的 Gemma 3 系列(之前是小型多模態模型的首選選項)的重大升級,並且與阿里巴巴最近的 Qwen3 VL 發布具有競爭力。

Magistral Medium 1.2 仍然是 Mistral 在人工分析智能指數中的整體領先模型。

有關這些新模型及其提供者的進一步分析,請參閱我們在人工分析上的模型頁面:
Mistral Large 3:
Ministral 14B:
Ministral 8B:
8.14K
熱門
排行
收藏

