Há 384 GB de VRAM rápida no Blackwell Tinybox 🧵
Cansamos de usar ferramentas de fornecedores para testes de largura de banda, então escrevemos uma universal em Tinygrad. As GPUs são conectadas em PCIe 5.0 x16
O GEMM da tocha em uma única placa é de 438 TFLOPS BF16 -> FP32. Isso coloca a máquina em 1,75 PFLOPS de desempenho real do GEMM.
No MMAPe, estamos com 3,1 PFLOPS em todos os cardos. É aqui que a falta de nerfs da 5090 realmente se destaca, é mais que o dobro do FLOPS bruto de um tinybox green v2!
Todas as nossas caixas Blackwell serão enviadas com nosso mais recente array RAID. **55,3 GB/s** de largura de banda de leitura comparada, que é mais rápida que a RAM da maioria dos celulares.
Enquanto esperamos pela fritadeira de GPU, aqui está o mmapeak. **3.1 PFLOPS** nas cartas fp16 -> fp32. É aqui que a falta de nerfs da 5090 realmente se destaca, é mais que o dobro do FLOPS bruto de um tinybox green v2!
Aqui está no huggingface/fritadeira da GPU. 2522W em potência máxima, não tem Max-Q por aqui!
As temperaturas finais em saturação após 15 minutos foram 72°C, 80°C, 71°C e 76°C. Ainda estamos trabalhando na política dos ventiladores e no layout dos cartões, os coolers são diferentes do que já usamos antes. Mas a máquina de transporte será *pelo menos* tão boa.
9,4K