Gedanken zu NVIDIA Rubin und AMD MI455X Lass uns einen Vergleich zwischen Nvidias Rubin und AMDs MI455X anstellen, die beide heute vorgestellt wurden. Beginnen wir mit Rubin, der eine 8-stufige HBM4-Konfiguration nutzt. Er bietet eine Speicherbandbreite von 22TB/s und verwendet Speicher mit einem pro-Pin Fmax von etwa 10,7Gbps. Auf der anderen Seite setzt der MI455X auf eine 12-stufige HBM4-Anordnung. Er liefert jedoch eine Bandbreite von 19,6TB/s und verwendet Speicher mit einem pro-Pin Fmax von ungefähr 6,4Gbps. Angesichts des aktuellen JEDEC-Standards für HBM4 von 8Gbps ist der Unterschied deutlich: Rubin nutzt erstklassige, hochspezifizierte HBM4, während der MI455X anscheinend auf HBM4 zurückgreift, das unter den Standardwerten liegt. Dies hebt eine deutliche Divergenz in der Unternehmensstrategie hervor: Verwendung von erstklassigen Komponenten vs. Kapazität durch brute force. AMD hat wahrscheinlich diesen Ansatz gewählt, weil es für sie herausfordernd ist, Volumen an Hochgeschwindigkeits-HBM4 zu sichern. Diese Strategie birgt jedoch zwei wesentliche Risiken. Erstens die Kosten- und Ertragsimplikationen. Das Anbringen von mehr HBM-Stapeln erfordert eine größere Interposer-Fläche, was die Stückkosten direkt erhöht. Darüber hinaus senkt eine größere Fläche zwangsläufig den Ertrag bei der 2.5D-Verpackungsassemblierung. Mit anderen Worten, die Strategie, mehr Einheiten von niedrig spezifiziertem HBM4 zu verwenden, könnte paradoxerweise teurer sein als Nvidias Strategie, weniger Einheiten von hochspezifiziertem HBM4 zu verwenden. Zweitens die Auswirkungen während Speicherengpässen. Dieser Ansatz verschärft Engpässe in der Lieferkette. Eine 12-stufige Konfiguration verbraucht 50 % mehr HBM-Chipletts/Stapel pro GPU im Vergleich zu einem 8-stufigen Design. Je knapper das globale HBM4-Angebot ist, desto mehr wird das Versandvolumen von AMD durch die Verfügbarkeit von Speicher begrenzt. Natürlich ist dies in den frühen Phasen, in denen die Erträge für hochspezifiziertes HBM4 niedrig sind, kein großes Problem – niedrige Erträge für Top-Bin-Teile führen natürlich zu einem Überangebot an niedrigeren Binned-Vorräten. Aber was passiert, wenn sich die Lernkurve der Erträge verbessert? Wenn die Erträge für hochspezifiziertes HBM4 steigen, haben die Lieferanten mehr Anreiz, Wafer den höherpreisigen Chips zuzuweisen, die für Nvidia bestimmt sind. Dies macht es für AMD zunehmend schwierig, große Mengen an niedrigleistungsfähigem HBM4 zu niedrigen Preisen zu beschaffen. Darüber hinaus wird AMD, da Samsung im HBM4-Bereich gut abschneidet, nicht in der Lage sein, Bestände zu "Abverkaufspreisen" zu erwerben, wie sie es während des HBM3E-Zyklus getan haben. Letztendlich sieht sich AMD einer von Natur aus nachteiligen Kostenstruktur auf Chip-Ebene im Vergleich zu Nvidias Rubin gegenüber.