Wawancara yang sangat mendalam dengan mantan karyawan $ORCL tentang penerapan GPU $NVDA dan ekonomi di baliknya: 1. Dalam pengalamannya, tolok ukur yang diberikan $NVDA sangat murah hati kepada diri mereka sendiri. Dia menyebutkan bahwa dia bahkan memiliki pengalaman di mana mereka turun sebesar 40%. Umumnya, sebagian besar penawaran GPU komputasi saat ini adalah penawaran jangka panjang yang sangat didiskon. 2. Dia memiliki ratusan ribu GPU dan cluster, dan 15% armadanya pada waktu tertentu sedang down. Ketika meminta suku cadang kepada $NVDA, dia tidak mendapatkannya, dan dia tidak bisa mengatakan apa-apa karena mereka akan memotong alokasinya. Dia menyebutkan bahwa $NVDA menyandera banyak pelanggan dengan mengantri untuk kapasitas di masa depan. Alasan mengapa 15% armada turun adalah 6% karena GPU, 5% karena flap jaringan, dan hal-hal kecil acak lainnya di server. 3. Dalam hal kegunaan masa pakai GPU ini, ia menyebutkan bahwa orang masih menggunakan $NVDA Volta dan Pascal. Tetapi masalah yang lebih besar adalah, dapatkah saya menggunakan ruang dan kekuatan itu untuk sesuatu yang lebih menarik, atau apakah pusat data itu terlalu tua dan Anda mengabaikannya? 4. Dia menyebutkan bahwa pengumuman $ORCL $AMD pertama untuk MI300X $AMD, $ORCL diliput sebagai $AMD berkomitmen untuk menyewa kembali beberapa GPU tersebut untuk upaya teknik mereka. 5. Bertentangan dengan pandangan industri, dia menyebutkan bahwa saat ini, di luar pemain besar, tidak ada banyak permintaan inferensi, karena perpindahan ke inferensi lambat di perusahaan menengah ke bawahnya. Dia memberikan contoh baru-baru ini dari Lambda yang memindahkan inferensi-sebagai-layanannya ke kapasitas pelatihan karena kurangnya permintaan inferensi. ditemukan di @AlphaSenseInc