一位前$ORCL员工关于部署$NVDA GPU及其背后经济学的深刻访谈: 1. 根据他的经验,$NVDA提供的基准测试对他们自己非常慷慨。他提到他甚至经历过偏差达到40%的情况。一般来说,目前大多数计算GPU交易都是长期的、打折幅度很大的交易。 2. 他拥有数十万的GPU和集群,任何时候他的机队中有15%处于故障状态。当向$NVDA请求备件时,他没有得到支持,他也不能说什么,因为他们会切断他的分配。他提到$NVDA让许多客户处于被动状态,排队等待未来的产能。机队中15%故障的原因是6%由于GPU,5%由于网络波动,以及服务器中的其他随机小问题。 3. 在这些GPU的使用寿命方面,他提到人们仍在使用$NVDA的Voltas和Pascals。但更大的问题是,我能否将这些空间和电力用于更有趣的事情,或者这个数据中心是否太旧而被忽视? 4. 他提到$ORCL和$AMD首次宣布$AMD的MI300X时,$ORCL被报道为$AMD承诺租用一些GPU用于他们的工程工作。 5. 与行业观点相反,他提到目前在大玩家之外,推理需求并不多,因为中小型公司及以下的推理转型进展缓慢。他举了最近的例子,Lambda因缺乏推理需求而将其推理即服务转向训练能力。 发现于@AlphaSenseInc