A NVIDIA adquiriu um potencial concorrente, anunciando ontem à noite um acordo de 20 bilhões de dólares em dinheiro com a startup de chips de IA Groq. Claro, o oficial também disse: não se trata da aquisição da empresa Groq, mas apenas da obtenção de uma licença de tecnologia, integrando os produtos da Groq em futuros produtos. A Groq foi fundada em 2016 por um grupo de ex-engenheiros do Google e é a base central do TPU, focando no design de chips aceleradores de IA de alto desempenho. Este movimento da NVIDIA pode ser visto como uma forma de atacar a retaguarda do Google, começando a acelerar seu foco em inferência. Na linha técnica, 1) equivale a NVIDIA mudar de uma rota única de GPU (unidade de processamento gráfico) para um modo de fusão de dupla via "GPU + LPU", passando de "computação paralela genérica" para "inferência determinística dedicada". 2) Especialmente na rota de armazenamento, de HBM para SRAM, HBM (memória de alta largura de banda), embora tenha grande capacidade, tem largura de banda limitada. O LPU da Groq depende quase completamente de SRAM (memória estática de acesso aleatório) em chip, com largura de banda de até 80 TB/s (cerca de 10 vezes a de HBM). Há quem diga que, no futuro, quanto mais forte for a narrativa da Groq, mais fraca poderá ser a narrativa de armazenamento. Isso requer atenção em relação à tendência futura dos direitos de armazenamento.