熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Chris McGuire
前 NSC、OSTP、國務院、國防部和 NSCAI |中國科技、人工智能、半導體 |所有觀點都是我自己的
我計劃很快寫一篇關於華為AI芯片路線圖的更詳細分析,但簡而言之,它並不令人印象深刻,並且突顯出華為預計美國和中國在AI芯片方面的差距將在未來幾年顯著擴大:
1️⃣ 華為計劃明年生產的AI芯片的處理能力和內存帶寬比他們今天生產的最佳芯片要低。這非常奇怪。
2️⃣ 華為計劃在2028年第四季度之前,不會生產出與Nvidia現在想要運送到中國的B30A同樣強大的芯片。
3️⃣ 到2027年(Nvidia路線圖的最後一年),Nvidia最好的AI芯片的處理能力將是華為最佳AI芯片的27倍。
華為自己認為,由於Nvidia使用更先進的工藝節點,而華為由於工具出口管制仍停留在7nm/5nm節點,華為將進一步落後。
華為的計劃是用數量更多但性能更差的芯片進行競爭,但他們生產足夠的芯片來彌補這一能力差距並不現實。華為/中芯國際必須在2027年前將其Ascend生產能力提升數百倍甚至數千倍,才能生產出與Nvidia相當的AI計算能力。這是極不可能的。如果華為無法製造出許多集群,那麼無論他們能在一個集群中放入多少中等水平的芯片都沒有意義。
而且這還不包括由於HBM供應或潛在的新美國工具出口管制所帶來的限制。只要我們不放棄,美國的AI硬件優勢預計將在不久的將來大幅增長。

Rui Ma9月18日 16:27
今天最重要的中國科技新聞是華為的芯片路線圖公告及相關突破。
關鍵要點:
路線圖:
910C(2025年),950PR/DT(2026年),960(2027年),970(2028年)。
表明計算、帶寬和內存擴展的升級節奏穩定。
內存自給自足:
從950系列開始,華為將使用自研的HBM高帶寬內存(HiBL 1.0,HiZQ 2.0),減少對外國供應商的依賴,建立供應鏈獨立性。
與NVIDIA的戰略定位:
NVIDIA的Blackwell Ultra GB300在單芯片級別仍然遙遙領先(15 PFLOPS FP4)。
華為承認差距,但強調互連和集群級別的擴展,聲稱在超節點計算能力上處於領先地位。請參見下面的引用。
集群雄心:
新的Atlas SuperPoDs到2027年可擴展至15,488張卡,儘管芯片較弱,但允許總計算能力與競爭對手相媲美或超越。
華為押注於系統級性能,而不僅僅是芯片規格。
跨領域擴展:
TaiShan 950 SuperPoD(2026年)超越AI,面向通用計算,目標是曾經由大型機承擔的角色。
以下是對《新智訊》報道的翻譯:
“在2025年華為全連接大會上,輪值主席徐直軍揭曉了公司的最新Ascend AI芯片路線圖。
在2025年第一季度,華為推出了Ascend 910C。
在2026年第一季度,將發佈Ascend 950PR,隨後在第四季度發佈Ascend 950DT。
在2027年第四季度,Ascend 960計劃發佈,Ascend 970將在2028年第四季度到來。
Ascend 910C基於SIMD架構,提供高達800 TFLOPS(FP16)的性能,支持FP32/HF32/FP16/BF16/INT8格式,784 GB/s的互連帶寬,128 GB HBM,以及3.2 TB/s的內存帶寬。
Ascend 950PR/DT將升級為SIMD/SIMT架構,達到1 PFLOPS(FP8)/2 PFLOPS(FP4)。它將支持更廣泛的格式(FP32到FP4),互連帶寬為2 TB/s。內存規格:
950PR:144 GB,4 TB/s帶寬。
950DT:128 GB,1.6 TB/s帶寬。
Ascend 960將性能翻倍,達到2 PFLOPS(FP8)/4 PFLOPS(FP4),互連帶寬為2.2 TB/s,HBM擴展至288 GB,帶寬為9.6 TB/s。
Ascend 970將再次將計算能力翻倍,達到4 PFLOPS(FP8)/8 PFLOPS(FP4),互連帶寬為4 TB/s。HBM容量將保持在288 GB,但帶寬將上升至14.4 TB/s。
重要的是,從950PR開始,華為的Ascend芯片將採用自研的HBM。950將配備HBM HiBL 1.0,而950DT將升級為HBM HiZQ 2.0。
作為比較,NVIDIA的Blackwell Ultra GB300提供15 PFLOPS(FP4)的計算,配備288 GB的HBM3e內存和8 TB/s的帶寬。
徐直軍承認:
“由於美國的制裁,我們無法在臺積電製造我們的芯片,因此我們的單芯片性能仍然落後於NVIDIA。但華為在連接人和機器方面有超過三十年的經驗。通過大量投資互連技術,我們取得了突破,使我們能夠構建數萬張卡的超節點。這使我們能夠在系統級別提供世界上最強大的計算能力。”
他強調,計算能力一直是、並將繼續是人工智能的關鍵——尤其是中國的AI。在他看來,超節點將成為AI基礎設施的新常態。華為的CloudMatrix 384超節點已經在300多套中部署,為20多家客戶服務。
展望未來,華為計劃在2025年第四季度推出Atlas 950 SuperPoD,配備8,192張卡,聲稱將是全球最強大的超節點。一個更大的Atlas 960 SuperPoD,配備15,488張卡,計劃在2027年第四季度推出。
徐還揭曉了全球首個通用計算超節點TaiShan 950 SuperPoD。基於Kunpeng 950,支持最多16個節點(32個處理器),48 TB內存,以及內存、SSD和DPU資源的池化。計劃在2026年第一季度發佈。徐將其描述為“大型機和小型機的終結。”

151
熱門
排行
收藏