tinybox red v2!4x9070XT,单个15A插头。人们的购买价格是多少?
4个GPU之间的全带宽PCIe 4 x16。32核EPYC处理器,128GB内存,2TB NVMe。
其实我为什么要使用AMD的带宽工具?这里有一个用tinygrad编码的版本。在标准的AMD驱动程序上支持GPU之间的完全P2P(与某些其他绿色公司不同,他们因为不友好而阻止这一点)
良好的数据类型支持,bf16 精度下的 MMAPEAK 为 165 TFLOPS,f32 为 315 TFLOPS 的 fp8。
良好的数据类型支持,bf16 精度下的 MMAPEAK 为 165 TFLOPS,f32 为 315 TFLOPS,fp8 为 315 TFLOPS。这当然是每张卡的性能。
对tinygrad AM驱动的全面支持,这意味着你可以rmmod amdgpu,它仍然可以工作!Python正在将PCIe BAR映射到进程中,并直接驱动GPU。
AMD 在 ROCm 上取得了巨大的进展。7.1 版本是标准配置,配合最新的 PyTorch。133 的 GEMM TFLOPS 达到 165 MMAPEAK 还不错,而且 amdgpu 驱动在 RDNA4 上似乎很稳定!
tinygrad 13 行 gpuburn!每张卡的功率达到 304W,电源供应器表现出色,在办公室几乎听不见。
这是使用 amdgpu 而不是 AM 驱动程序的结果。我不知道它在说什么低功耗状态,那是最大功率,看看在燃烧 10 分钟后那些冰冷的温度!
看起来像是标准的小盒子,漂亮的前屏幕,大的可点击按钮,令人放松的圆圈。
12.37K