由於亞馬遜讓人很難嘗試其新模型,我還沒有試過 Nova 2 Pro。 所以看起來還不錯?他們從來沒有處於成本/性能的前沿,而新的 Nova 2 繼續在某些代理基準上散佈著較高的分數,總體上仍然落後於其他 AI。
Artificial Analysis
Artificial Analysis10 小時前
亞馬遜推出了 Nova 2.0,這是一個相較於之前的亞馬遜 Nova 型號的重大升級,並在代理能力方面展現出特別的強大。 亞馬遜發布了 Nova 2.0 Pro(預覽版),這是其新的旗艦型號;Nova 2.0 Lite,專注於速度和降低成本;以及 Nova 2.0 Omni,一個多模態模型,能夠處理文本、圖像、視頻和語音輸入,並輸出文本和圖像。 關鍵基準測試要點: 亞馬遜重回頂尖 AI 玩家行列:這是亞馬遜自 Nova Premier 以來的最新發布,也是亞馬遜首次發布推理模型。Nova 2.0 Pro 在人工分析智能指數上比 Premier 提升了 30 分,而 Lite 則提升了 38 分。這代表著能力的巨大增長,並使亞馬遜重回頂尖 AI 玩家之列。 在代理能力方面的優勢:代理能力,包括工具調用,是這些模型的一大優勢,Nova 2.0 Pro 在 τ²-Bench Telecom 上的得分為 93%,在 IFBench 上的中高推理預算得分為 80%(高推理的完整基準測試即將推出)。這使得 Nova 2.0 Pro 預覽版在這些基準測試中名列前茅。 多模態:Nova 2.0 Omni 是少數幾個能夠原生處理文本、圖像、視頻和語音輸入的模型之一,尤其是與 Gemini 模型系列相比。這是亞馬遜 Nova 模型系列的一個新區別。 具競爭力的定價:亞馬遜將 Nova 2.0 Pro 的價格定為每百萬個輸入/輸出標記 $1.25/$10,考慮到標記使用,該模型運行我們的人工分析智能指數花費了 $662。這比其他前沿模型如 Claude 4.5 Sonnet($817)和 Gemini 3 Pro($1201)要低得多,但仍高於其他模型,包括 Kimi K2 Thinking($380)。Nova 2.0 Lite 和 Omni 的價格均為每百萬個輸入/輸出標記 $0.3/$2.5。 請參見下方以獲取進一步分析。
我不完全確定 Nova 的市場是什麼(除了「沒有模型偏好的 AWS 客戶」),但值得注意的是,亞馬遜仍然在 LLM 競賽中。
19.82K