谷歌 TPU v6e、AMD MI300X 和英偉達 H100/B200 性能對比出爐! Artificial Analysis 硬件基準測試顯示,英偉達在推理成本上領先:每美元 token 數量是 TPU v6e 的 5 倍、AMD 的 2 倍。 在 30 token/秒的參考速率下,英偉達 H100 每百萬 token 成本僅 $1.06,而 MI300X 為 $2.24,TPU v6e 高達 $5.13。 TPU v7 即將發佈,性能大躍進,但定價未知。
Artificial Analysis系統負載測試對性能如何隨併發擴展進行基準測試的詳細結果。
3.69K