Декілька актуальних думок про TPU та $GOOG По-перше: відхилити бенчмаркинг недійсних параметрів Не сперечайтеся про те, наскільки різні параметри GPU і TPU, наскільки дорога міграція і хто кращий. Який у цьому сенс? $GOOG взагалі не є напівпровідниковою компанією, і TPU — це не товар, який готовий продавати всюди. Вони почали розкладати майже десять років тому і повністю служать їхньому бізнесу. Вони навіть самі цього не мають достатньо, тож як вони можуть мати час її тобі продати? Це як Amazon займається логістикою — для власного темпу, а не для продажу вантажівок. Так само це не можна використовувати для FUD $nvda Dazi для продажу карток, $goog не для продажу карток, як порівнювати? Нерозумно використовувати цей FUD Dazi. По-друге: Суть Gemini — це «можливості індустріалізації» Всі створюють саму модель, ігноруючи важливіший момент комерційного посадки: вартість і швидкість (економіка одиниць). Досвід Gemini підказує мені, що Google використовує нативні переваги TPU, щоб підвищити вартість AI-виведення до мінімальної ціни, зберігаючи при цьому надзвичайно низьку затримку. Якщо ШІ стане «інфраструктурою» в майбутньому, «легкий у використанні, дешевий і відповідатиме в реальному часі» буде набагато важливішим за «надзвичайно розумний, але невідповідний» для 95% випадків користувача (перевірка інформації, написання листів і підсумки). Зверніть увагу, що наведене вище — це гіпотеза про майбутнє, ШІ ще не визначився, і ніхто не знає, яким має бути його майбутнє. $GOOG Це як Ford або Toyota року. Вони запровадили конвеєрні лінії (кластери TPU) і створили компактну виробничу лінію (JAX/рідке охолодження), інтегрувавши програмне та апаратне забезпечення, перетворивши автомобілі на доступний товар для кожної родини, а не на розкіш для багатих на початку свого народження. Нарешті: Я не казав, що $NVDA поганий, і що інші моделі не можуть. ...