熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
DeepSeek V3.2 是第二智能的開放權重模型,並且在 Grok 4 和 Claude Sonnet 4.5 (思考) 之前排名 - 它將 DeepSeek 稀疏注意力從「實驗」狀態中解脫出來,並與智能的實質提升相結合。
@deepseek_ai V3.2 在人工分析智能指數上得分 66;相比於 2025 年 9 月發布的 DeepSeek V3.2-Exp (+9 分),這是一個實質的智能提升。DeepSeek 已將其主要 API 端點切換至 V3.2,並且 V3.2-Exp 的定價沒有變化 - 這使得定價僅為每 1M 輸入/輸出代幣 $0.28/$0.42,對於緩存的輸入代幣則有 90% 的折扣。
自從大約 11 個月前在 2024 年 12 月底發布的原始 DeepSeek V3 以來,DeepSeek 的 V3 架構擁有 671B 總參數/37B 活躍參數,已經從一個得分 32 的模型提升至在人工分析智能指數上得分 66。
DeepSeek 還發布了 V3.2-Speciale,這是一個僅限推理的變體,具有增強的能力,但代幣使用量顯著增加。這是推理模型中的一個常見權衡,增強的推理通常會產生更高的智能得分和更多的輸出代幣。V3.2-Speciale 可通過 DeepSeek 的第一方 API 獲得,直到 12 月 15 日。
目前 V3.2-Speciale 在人工分析智能指數上的得分 (59) 低於 V3.2 (推理,66),因為 DeepSeek 的第一方 API 尚不支持此模型的工具調用。如果 V3.2-Speciale 在啟用工具調用的情況下達到 V3.2 的 tau2 得分 (91%),它將在智能指數上得分約 68,使其成為最智能的開放權重模型。V3.2-Speciale 使用 160M 輸出代幣來運行人工分析智能指數,幾乎是 V3.2 在推理模式下使用的代幣數量的兩倍。
DeepSeek V3.2 使用與 V3.2-Exp 相同的架構,後者引入了 DeepSeek 稀疏注意力 (DSA),以減少長上下文推理所需的計算。我們的長上下文推理基準顯示引入 DSA 對智能沒有成本影響。DeepSeek 通過將其第一方 API 的定價從 $0.56/$1.68 降至 $0.28/$0.42 每 1M 輸入/輸出代幣,反映了 V3.2-Exp 的成本優勢 - 分別減少了 50% 和 75% 的輸入和輸出代幣定價。
關鍵基準要點:
➤🧠 DeepSeek V3.2:在推理模式下,DeepSeek V3.2 在人工分析智能指數上得分 66,與 Kimi K2 思考 (67) 相當,並且在 Grok 4 (65)、Grok 4.1 快速 (推理,64) 和 Claude Sonnet 4.5 (思考,63) 之前。與 V3.2-Exp (57) 相比,它在工具使用、長上下文推理和編碼方面顯示出顯著的提升。
➤🧠 DeepSeek V3.2-Speciale:V3.2-Speciale 在我們的智能指數中在 10 個基準中的 7 個上得分高於 V3.2 (推理)。V3.2-Speciale 現在在 AIME25 (97%) 和 LiveCodeBench (90%) 中分別擁有所有模型中最高和第二高的得分。然而,如上所述,DeepSeek 的 V3.2-Speciale 第一方 API 尚不支持工具調用,該模型在 tau2 基準上得分為 0。
➤📚 幻覺和知識:DeepSeek V3.2-Speciale 和 V3.2 是人工分析全知指數上排名最高的開放權重模型,得分分別為 -19 和 -23。來自 Google、Anthropic、OpenAI 和 xAI 的專有模型通常在此指數中領先。
➤⚡ 非推理性能:在非推理模式下,DeepSeek V3.2 在人工分析智能指數上得分 52 (+6 分 vs. V3.2-Exp),是第三智能的非推理模型。DeepSeek V3.2 (非推理) 與 2025 年 5 月的前沿推理模型 DeepSeek R1 0528 的智能相匹配,突顯了今年通過預訓練和強化學習改進所取得的快速智能增長。
➤⚙️ 代幣效率:在推理模式下,DeepSeek V3.2 使用的代幣數量比 V3.2-Exp 多,以運行人工分析智能指數 (從 62M 增加到 86M)。在非推理變體中,代幣使用量保持相似。V3.2-Speciale 顯示出顯著更高的代幣使用量,使用約 160M 輸出代幣,超過 Kimi K2 思考 (140M) 和 Grok 4 (120M)。
➤💲定價:DeepSeek 尚未更新其第一方的每個代幣定價,所有三個變體的定價均為每 1M 輸入/輸出代幣 $0.28/$0.42。
其他模型詳情:
➤ ©️ 授權:DeepSeek V3.2 在 MIT 許可下提供。
➤ 🌐 可用性:DeepSeek V3.2 可通過 DeepSeek API 獲得,該 API 已取代 DeepSeek V3.2-Exp。用戶可以通過臨時 DeepSeek API 獲得 DeepSeek V3.2-Speciale,直到 12 月 15 日。考慮到此次發布的智能提升,我們預計許多第三方提供商將很快提供此模型。
➤ 📏 大小:DeepSeek V3.2 Exp 擁有 671B 總參數和 37B 活躍參數。這與 DeepSeek V3 和 R1 系列中的所有先前模型相同。

在DeepSeek的第一方API定價為每百萬個輸入/輸出代幣$0.28/$0.42的情況下,V3.2(推理)位於人工分析智能指數圖的智力與運行成本的帕累托邊界上。

DeepSeek V3.2-Speciale 是人工分析全知指數上排名最高的開放權重模型,而 V3.2(推理)則與 Kimi K2 Thinking 相匹配。

DeepSeek V3.2 在推理模式下比其前身更冗長,使用更多的輸出標記來運行人工分析智能指數(86M 對比 62M)。

比較 DeepSeek V3.2 與您正在使用或考慮的模型的表現:
66.98K
熱門
排行
收藏

