Google — это компания, которой не хватает вычислительной мощности меньше всего, она даже более обеспечена, чем NVIDIA. Даже GPU от NVIDIA, вероятно, следует за TPU (это полупрозрачный консенсус в кругу специалистов). 1️⃣ Тензорные ядра (Tensor Core) NVIDIA полностью внедрила их после Volta, по сути, это приближение к специализированным матричным умножениям TPU. 2️⃣ Низкопроизводительные вычисления (FP16 / BF16 / INT8) TPU давно оптимизировала низкую точность для вывода, в то время как GPU позже были «вынуждены» поддерживать это по требованию моделей. 3️⃣ Масштабные кластеры + сотрудничество компиляторов TPU — это целостная система «аппаратное обеспечение × компилятор × планирование», в то время как NVIDIA только начинает серьезно заниматься сотрудничеством на уровне Triton / CUDA Graph / NVLink. NVIDIA зарабатывает на вычислительной мощности чипов, в то время как Google полагается на стабильную экосистему, которая включает рекламу, поисковую систему, YouTube, браузер, Android и другие сетевые явления, которые обеспечивают финансирование; вычислительная мощность — это лишь их затраты, а не потребление прибыли. TPU всегда разрабатывался Google с нуля, что позволяет проводить достаточно длительные исследования и пересмотры. Джефф Дин понимает TPU так: если модель определена вами, то и аппаратное обеспечение должно быть определено вами, поэтому TPU — это целый системный проект, включающий компилятор (XLA), вычислительный граф (TensorFlow), топологию дата-центра и систему планирования. С точки зрения рисков, поскольку NVIDIA продает GPU, она должна обслуживать всех клиентов, что приводит к очень низкой степени отказоустойчивости. Теперь стало яснее, какие акции американских компаний стоит покупать.