Několik aktuálních myšlenek o TPU a $GOOG Za prvé: Odmítnout benchmarking neplatných parametrů Nehádejte se o tom, jak moc se parametry GPU a TPU liší, jak drahá je migrace a kdo je lepší. Jaký to má smysl? $GOOG není polovodičová firma a TPU není komodita připravená k prodeji všude. Začali s přípravou téměř před deseti lety a slouží výhradně svému podnikání. Ani oni sami toho nemají dost, tak jak by měli čas vám to prodat? Je to jako kdyby Amazon dělal logistiku, pro svou vlastní rychlost, ne pro prodej nákladních aut. Stejně tak to nelze použít k FUD $nvda Dazi k prodeji karet, $goog ne k prodeji karet, jak to porovnat? Není rozumné, abys používal tento FUD Dazi. Za druhé: Jádrem Gemini jsou "schopnosti industrializace" Všichni si model skládají, ale ignorují důležitější bod komerčního přistání: náklady a rychlost (jednotková ekonomika). Zkušenost Gemini mi říká, že Google využívá nativní výhody TPU k posunutí ceny AI inference na minimální cenu, přičemž udržuje extrémně nízkou latenci. Pokud se AI v budoucnu stane "infrastrukturou", "snadné použití, levné a reagující v reálném čase" je mnohem důležitější než "extrémně chytrá, ale nereaguje" v 95 % scénářů uživatelů (kontrola informací, psaní e-mailů a vytváření shrnutí). Vezměte prosím na vědomí, že výše uvedené je hypotéza o budoucnosti, AI je nerozhodnutá a nikdo neví, jak by měla vypadat její budoucnost. $GOOG Je to jako Ford nebo Toyota roku. Zavedli montážní linky (TPU clustery) a vytvořili štíhlou výrobní linku (JAX/kapalinové chlazení), která integrovala software a hardware, čímž proměnila auta v cenově dostupnou položku pro každou domácnost, místo aby byla luxusní položkou pro bohaté na počátku svého vzniku. Konečně: Neřekl jsem, že $NVDA je špatný, ani že jiné modely nemohou. ...