Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Chris McGuire
Antigo NSC, OSTP, Estado, DoD e NSCAI | China tecnologia, IA, semicondutores | Todas as visualizações minhas
Planeio escrever uma análise mais detalhada sobre o roteiro de chips de IA da Huawei em breve, mas a versão curta é que não é muito impressionante e destaca que a Huawei antecipa que a diferença entre os Estados Unidos e a China em chips de IA deverá aumentar significativamente nos próximos anos:
1️⃣ Os chips de IA que a Huawei planeia fabricar no próximo ano têm MENOS poder de processamento e largura de banda de memória do que os melhores chips que fabricam hoje. Isso é muito estranho.
2️⃣ A Huawei não planeia produzir um chip tão poderoso quanto o B30A, que a Nvidia quer enviar para a China agora, até o quarto trimestre de 2028.
3️⃣ Em 2027 (o último ano do roteiro da Nvidia), os melhores chips de IA da Nvidia terão 27 VEZES o poder de processamento dos melhores chips de IA da Huawei.
A própria Huawei acredita que, à medida que a Nvidia utiliza nós mais avançados e a Huawei permanece presa nos nós de 7nm/5nm devido a controles de exportação de ferramentas, a Huawei ficará ainda mais para trás.
O plano da Huawei é competir com um maior número de chips inferiores, mas simplesmente não é realista para eles produzirem chips suficientes para preencher essa lacuna de capacidade. A Huawei/SMIC teria que aumentar suas capacidades de produção de Ascend em muitas centenas e potencialmente milhares de vezes entre agora e 2027 para produzir tanto poder computacional de IA quanto a Nvidia. Isso é extremamente improvável. Não importa quantos chips medianos a Huawei consiga colocar em um cluster se não conseguir fazer muitos clusters.
E isso sem mencionar as restrições devido ao fornecimento de HBM ou potenciais novos controles de exportação dos EUA sobre ferramentas. As vantagens de hardware de IA dos EUA devem crescer tremendamente no futuro próximo, desde que não as entreguemos.

Rui Ma18/09, 16:27
A notícia mais importante da tecnologia na China hoje é o anúncio do roteiro de chips da Huawei e os avanços associados.
Principais conclusões:
Roteiro:
910C (2025), 950PR/DT (2026), 960 (2027), 970 (2028).
Indicando uma cadência constante de atualizações em computação, largura de banda e escalonamento de memória.
Autossuficiência em Memória:
A partir da série 950, a Huawei usará memória HBM de alta largura de banda (HiBL 1.0, HiZQ 2.0) desenvolvida internamente, reduzindo a dependência de fornecedores estrangeiros e construindo independência na cadeia de suprimentos.
Posicionamento Estratégico vs NVIDIA:
O Blackwell Ultra GB300 da NVIDIA ainda está muito à frente no nível de chip único (15 PFLOPS FP4).
A Huawei reconhece a lacuna, mas enfatiza o escalonamento em interconexão e nível de cluster, reivindicando liderança em poder computacional de super-nodes. Veja as citações abaixo.
Ambição de Cluster:
Novos Atlas SuperPoDs escalam até 15.488 placas até 2027, permitindo que a computação agregada rivalize ou supere os concorrentes, apesar de chips mais fracos.
A Huawei está apostando no desempenho em nível de sistema, não apenas nas especificações do chip.
Expansão Cross-Domain:
O TaiShan 950 SuperPoD (2026) se estende além da IA para computação de propósito geral, visando o papel que antes era preenchido por mainframes.
Tradução da cobertura da Xinzhixun abaixo:
"No dia 18 de setembro, na Conferência Huawei Full Connect 2025, o presidente rotativo Xu Zhijun revelou o mais recente roteiro de chips de IA Ascend da empresa.
No Q1 de 2025, a Huawei lançou o Ascend 910C.
No Q1 de 2026, lançará o Ascend 950PR, seguido pelo Ascend 950DT no Q4.
No Q4 de 2027, o Ascend 960 está programado, e o Ascend 970 chegará no Q4 de 2028.
O Ascend 910C é construído em uma arquitetura SIMD, entregando até 800 TFLOPS (FP16), com suporte para formatos FP32/HF32/FP16/BF16/INT8, largura de banda de interconexão de 784 GB/s, 128 GB de HBM e largura de banda de memória de 3,2 TB/s.
O Ascend 950PR/DT fará a atualização para uma arquitetura SIMD/SIMT, alcançando 1 PFLOPS (FP8) / 2 PFLOPS (FP4). Ele suportará uma gama mais ampla de formatos (FP32 a FP4), com largura de banda de interconexão de 2 TB/s. Especificações de memória:
950PR: 144 GB, largura de banda de 4 TB/s.
950DT: 128 GB, largura de banda de 1,6 TB/s.
O Ascend 960 dobrará o desempenho para 2 PFLOPS (FP8) / 4 PFLOPS (FP4), com 2,2 TB/s de interconexão, e HBM expandido para 288 GB e largura de banda de 9,6 TB/s.
O Ascend 970 dobrará novamente a computação para 4 PFLOPS (FP8) / 8 PFLOPS (FP4), com 4 TB/s de interconexão. A capacidade de HBM permanecerá em 288 GB, mas a largura de banda aumentará para 14,4 TB/s.
Importante, a partir do 950PR, os chips Ascend da Huawei adotarão HBM desenvolvido internamente. O 950 contará com HBM HiBL 1.0, enquanto o 950DT fará a atualização para HBM HiZQ 2.0.
Para comparação, o Blackwell Ultra GB300 da NVIDIA entrega 15 PFLOPS (FP4) de computação, emparelhado com 288 GB de memória HBM3e e largura de banda de 8 TB/s.
Xu Zhijun reconheceu:
"Devido às sanções dos EUA, não podemos fabricar nossos chips na TSMC, então nosso desempenho em chip único ainda está atrás da NVIDIA. Mas a Huawei tem mais de trinta anos de experiência em conectar pessoas e máquinas. Ao investir pesadamente em tecnologia de interconexão, fizemos avanços que nos permitem construir super-nodes com dezenas de milhares de placas. Isso nos dá a capacidade de entregar a computação mais poderosa do mundo—em nível de sistema."
Ele enfatizou que o poder computacional sempre foi, e continuará a ser, a chave para a inteligência artificial—e especialmente para a IA da China. Em sua visão, super-nodes se tornarão a nova norma na infraestrutura de IA. O super-node CloudMatrix 384 da Huawei já foi implantado em mais de 300 conjuntos, atendendo mais de 20 clientes.
Olhando para o futuro, a Huawei planeja lançar o Atlas 950 SuperPoD no Q4 de 2025, com 8.192 placas, que afirma ser o super-node mais poderoso globalmente. Um Atlas 960 SuperPoD ainda maior, com 15.488 placas, está previsto para o Q4 de 2027.
Xu também revelou o primeiro super-node de computação de propósito geral do mundo, o TaiShan 950 SuperPoD. Construído sobre o Kunpeng 950, suporta até 16 nós (32 processadores), 48 TB de memória e agrupamento de memória, SSD e recursos de DPU. Está programado para lançamento no Q1 de 2026. Xu descreveu-o como o "fim dos mainframes e minicomputadores."

169
Top
Classificação
Favoritos