扎克·詹森 TPU/GPU 博弈论对话 扎克: “谷歌给我提供了早期的 TPU v7/v8。我正在将大规模的 Llama 运行迁移到那里。我希望 B200 的定价能反映这一点。” 詹森: “那就使用 TPUs。如果你相信它们能按计划交付,就全力以赴。” 扎克: “我很认真。我可以将我的 NVIDIA 足迹削减三分之一。” 詹森: “很好。这为希望保证交付的客户释放了 CoWoS。你的配额从下个季度开始减少。” 扎克: “…等等。我们仍然需要 H100/B200 的基线用于主流模型。” 詹森: “你会得到一些配额。但不是优先权。你分割了需求——其他人就会排在前面。” 扎克: “詹森,TPU v7/v8 会缩小差距。我们会没事的。” 詹森: “这正是 Anthropic 在他们的编译器延迟之前所说的。这正是 OpenAI 在他们回来要更多 H100s 之前所说的。每个人都认为他们可以双重堆叠。能做到的寥寥无几。” 扎克: “我们有工程人才。” 詹森:...