一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

Chris McGuire

前 NSC、OSTP、國務院、國防部和 NSCAI |中國科技、人工智能、半導體 |所有觀點都是我自己的

我計劃很快寫一篇關於華為AI芯片路線圖的更詳細分析，但簡而言之，它並不令人印象深刻，並且突顯出華為預計美國和中國在AI芯片方面的差距將在未來幾年顯著擴大： 1️⃣ 華為計劃明年生產的AI芯片的處理能力和內存帶寬比他們今天生產的最佳芯片要低。這非常奇怪。 2️⃣ 華為計劃在2028年第四季度之前，不會生產出與Nvidia現在想要運送到中國的B30A同樣強大的芯片。 3️⃣ 到2027年（Nvidia路線圖的最後一年），Nvidia最好的AI芯片的處理能力將是華為最佳AI芯片的27倍。華為自己認為，由於Nvidia使用更先進的工藝節點，而華為由於工具出口管制仍停留在7nm/5nm節點，華為將進一步落後。華為的計劃是用數量更多但性能更差的芯片進行競爭，但他們生產足夠的芯片來彌補這一能力差距並不現實。華為/中芯國際必須在2027年前將其Ascend生產能力提升數百倍甚至數千倍，才能生產出與Nvidia相當的AI計算能力。這是極不可能的。如果華為無法製造出許多集群，那麼無論他們能在一個集群中放入多少中等水平的芯片都沒有意義。而且這還不包括由於HBM供應或潛在的新美國工具出口管制所帶來的限制。只要我們不放棄，美國的AI硬件優勢預計將在不久的將來大幅增長。

今天最重要的中國科技新聞是華為的芯片路線圖公告及相關突破。關鍵要點：路線圖： 910C（2025年），950PR/DT（2026年），960（2027年），970（2028年）。表明計算、帶寬和內存擴展的升級節奏穩定。內存自給自足：從950系列開始，華為將使用自研的HBM高帶寬內存（HiBL 1.0，HiZQ 2.0），減少對外國供應商的依賴，建立供應鏈獨立性。與NVIDIA的戰略定位： NVIDIA的Blackwell Ultra GB300在單芯片級別仍然遙遙領先（15 PFLOPS FP4）。華為承認差距，但強調互連和集群級別的擴展，聲稱在超節點計算能力上處於領先地位。請參見下面的引用。集群雄心：新的Atlas SuperPoDs到2027年可擴展至15,488張卡，儘管芯片較弱，但允許總計算能力與競爭對手相媲美或超越。華為押注於系統級性能，而不僅僅是芯片規格。跨領域擴展： TaiShan 950 SuperPoD（2026年）超越AI，面向通用計算，目標是曾經由大型機承擔的角色。以下是對《新智訊》報道的翻譯： “在2025年華為全連接大會上，輪值主席徐直軍揭曉了公司的最新Ascend AI芯片路線圖。在2025年第一季度，華為推出了Ascend 910C。在2026年第一季度，將發佈Ascend 950PR，隨後在第四季度發佈Ascend 950DT。在2027年第四季度，Ascend 960計劃發佈，Ascend 970將在2028年第四季度到來。 Ascend 910C基於SIMD架構，提供高達800 TFLOPS（FP16）的性能，支持FP32/HF32/FP16/BF16/INT8格式，784 GB/s的互連帶寬，128 GB HBM，以及3.2 TB/s的內存帶寬。 Ascend 950PR/DT將升級為SIMD/SIMT架構，達到1 PFLOPS（FP8）/2 PFLOPS（FP4）。它將支持更廣泛的格式（FP32到FP4），互連帶寬為2 TB/s。內存規格： 950PR：144 GB，4 TB/s帶寬。 950DT：128 GB，1.6 TB/s帶寬。 Ascend 960將性能翻倍，達到2 PFLOPS（FP8）/4 PFLOPS（FP4），互連帶寬為2.2 TB/s，HBM擴展至288 GB，帶寬為9.6 TB/s。 Ascend 970將再次將計算能力翻倍，達到4 PFLOPS（FP8）/8 PFLOPS（FP4），互連帶寬為4 TB/s。HBM容量將保持在288 GB，但帶寬將上升至14.4 TB/s。重要的是，從950PR開始，華為的Ascend芯片將採用自研的HBM。950將配備HBM HiBL 1.0，而950DT將升級為HBM HiZQ 2.0。作為比較，NVIDIA的Blackwell Ultra GB300提供15 PFLOPS（FP4）的計算，配備288 GB的HBM3e內存和8 TB/s的帶寬。徐直軍承認： “由於美國的制裁，我們無法在臺積電製造我們的芯片，因此我們的單芯片性能仍然落後於NVIDIA。但華為在連接人和機器方面有超過三十年的經驗。通過大量投資互連技術，我們取得了突破，使我們能夠構建數萬張卡的超節點。這使我們能夠在系統級別提供世界上最強大的計算能力。” 他強調，計算能力一直是、並將繼續是人工智能的關鍵——尤其是中國的AI。在他看來，超節點將成為AI基礎設施的新常態。華為的CloudMatrix 384超節點已經在300多套中部署，為20多家客戶服務。展望未來，華為計劃在2025年第四季度推出Atlas 950 SuperPoD，配備8,192張卡，聲稱將是全球最強大的超節點。一個更大的Atlas 960 SuperPoD，配備15,488張卡，計劃在2027年第四季度推出。徐還揭曉了全球首個通用計算超節點TaiShan 950 SuperPoD。基於Kunpeng 950，支持最多16個節點（32個處理器），48 TB內存，以及內存、SSD和DPU資源的池化。計劃在2026年第一季度發佈。徐將其描述為“大型機和小型機的終結。”