W Blackwell tinybox znajduje się 384 GB szybkiej VRAM 🧵
Znudziło nam się korzystanie z narzędzi dostawców do testów przepustowości, więc napisaliśmy uniwersalne narzędzie w tinygrad. GPU są podłączone na pełnym PCIe 5.0 x16
Wydajność GEMM na pojedynczej karcie wynosi 438 TFLOPS BF16 -> FP32. To stawia maszynę na poziomie 1,75 PFLOPS rzeczywistej wydajności GEMM.
W mmapeak osiągamy 3,1 PFLOPS na kartach. Tutaj brak nerfienia 5090 naprawdę się wyróżnia, to więcej niż dwa razy większa surowa wydajność FLOPS niż w tinybox green v2!
Wszystkie nasze skrzynki Blackwell będą wysyłane z naszym najnowszym zestawem RAID. **55,3 GB/s** zmierzonej przepustowości odczytu, co jest szybsze niż RAM w większości telefonów komórkowych.
Czekając na gpu-fryer, oto mmapeak. **3.1 PFLOPS** na kartach fp16 -> fp32. Tutaj brak nerfienia 5090 naprawdę się wyróżnia, to więcej niż dwa razy większa surowa wydajność FLOPS niż w tinybox green v2!
Oto to w huggingface/gpu-fryer. 2522W przy pełnej mocy, żadnego Max-Q w pobliżu!
Ostateczne temperatury przy nasyceniu po 15 minutach wyniosły 72C, 80C, 71C i 76C. Wciąż pracujemy nad polityką wentylatorów i układem kart, chłodnice różnią się od tych, z którymi pracowaliśmy wcześniej. Ale maszyna wysyłkowa będzie *przynajmniej* tak dobra.
8,43K