Blackwell tinybox 中有 384 GB 的快速 VRAM 🧵
我們厭倦了使用供應商工具進行帶寬測試,因此我們在 tinygrad 中編寫了一個通用工具。GPU 以全速 PCIe 5.0 x16 連接。
單卡的torch GEMM性能為438 TFLOPS BF16 -> FP32。這使得該機器的實際GEMM性能達到1.75 PFLOPS。
在 mmapeak,我們的顯示卡達到了 3.1 PFLOPS。這裡是 5090 的削弱缺失真正突顯的地方,它的原始 FLOPS 超過 tinybox green v2 的兩倍!
我們所有的 Blackwell 盒子將配備我們最新的 RAID 陣列。**55.3 GB/s** 的基準讀取帶寬,這比大多數手機上的 RAM 還要快。
在我們等待 gpu-fryer 的同時,這是 mmapeak。**3.1 PFLOPS** 在卡片 fp16 -> fp32 之間。5090 的削弱在這裡真正顯現出來,它的原始 FLOPS 是 tinybox green v2 的兩倍多!
這就是在 huggingface/gpu-fryer 裡的情況。全功率下為 2522W,這裡沒有 Max-Q!
在飽和狀態下,15分鐘後的最終溫度為72°C、80°C、71°C和76°C。我們仍在研究風扇政策和卡片佈局,冷卻器與我們之前使用的不同。但運輸機器至少會這麼好。
8.43K