由于亚马逊让人很难尝试其新模型,我还没有试过 Nova 2 Pro 所以看起来还不错?他们从来没有处于成本/性能的前沿,而新的 Nova 2 在一些代理基准测试中得分较高,但总体上仍然落后于其他人工智能。
Artificial Analysis
Artificial Analysis10 小时前
亚马逊推出了Nova 2.0,这是对之前亚马逊Nova模型的重大升级,展现了在代理能力方面的特别强大。 亚马逊发布了Nova 2.0 Pro(预览版),这是其新的旗舰模型;Nova 2.0 Lite,专注于速度和降低成本;以及Nova 2.0 Omni,一个多模态模型,能够处理文本、图像、视频和语音输入,并输出文本和图像。 关键基准测试要点: 亚马逊重返顶级AI玩家行列:这是亚马逊自Nova Premier以来的最新发布,也是亚马逊首次发布推理模型。Nova 2.0 Pro在人工分析智能指数上比Premier提高了30分,而Lite提高了38分。这代表了能力的巨大提升,亚马逊重新回到了顶级AI玩家之中。 在代理能力方面的优势:代理能力,包括工具调用,是这些模型的强项,Nova 2.0 Pro在τ²-Bench Telecom上得分93%,在IFBench上在中等和高推理预算下分别得分80%(高推理的完整基准测试即将发布)。这使得Nova 2.0 Pro预览版在这些基准测试中名列前茅。 多模态:Nova 2.0 Omni是少数几个能够原生处理文本、图像、视频和语音输入的模型之一,尤其是与Gemini模型系列相比。这是亚马逊Nova模型系列的新差异化特征。 具有竞争力的定价:亚马逊将Nova 2.0 Pro的定价定为每百万输入/输出令牌1.25美元/10美元,考虑到令牌使用,该模型在运行我们的人工分析智能指数时花费了662美元。这远低于其他前沿模型,如Claude 4.5 Sonnet(817美元)和Gemini 3 Pro(1201美元),但仍高于其他模型,包括Kimi K2 Thinking(380美元)。Nova 2.0 Lite和Omni的定价均为每百万输入/输出令牌0.3美元/2.5美元。 请参见下文以获取进一步分析。
我对Nova的市场并不是100%确定(除了“没有模型偏好的AWS客户”),但值得注意的是,亚马逊仍然在LLM竞赛中。
19.82K