目前關於 TPU 和 $GOOG 的幾個想法 第一:拒絕無效的參數對標 別再爭論 GPU TPU參數相差多少、遷移成本有多高,誰更牛逼。這有啥意義? $GOOG 本來就不是半導體公司,TPU 也不是準備到處去賣的商品。 他們近十年前就開始佈局並完全是為了服務於自己的業務。這玩意兒他們自己用都不夠,哪有空賣給你? 這就像亞馬遜搞物流一樣,是為了自己快,而不是為了賣卡車。 同理,這也不能用來 FUD $nvda 達子賣卡的, $goog 不賣卡,怎麼比?你用這個FUD 達子很不合理。 第二:Gemini 的核心是“工業化能力” 大家都在卷模型本身牛不牛逼,但忽略了商業落地更重要的一點:成本與速度(Unit Economics)。 Gemini 的體驗告訴我,Google 正在利用 TPU 的原生優勢,將 AI 推理的成本打到地板價,同時保持極低的延遲。 如果 AI 在未來成為一種“基礎設施”,對於 95% 的用戶場景(查資料、寫郵件、做摘要),“好用、便宜、實時響應” 遠比 “極其聰明但反應遲鈍” 重要。 請注意,以上是一種對於未來的假設,AI 乾坤未定,沒有人知道其未來究竟應該是一種什麼形態。 $GOOG 就像是當年的福特或豐田。 他們引入了流水線(TPU集群),打造了軟硬一體的精益產線(JAX/液冷),把汽車變成了家家戶戶買得起的尋常物,而不是誕生之初的富人奢侈品。 最後: 我沒有說 $NVDA 不好,也沒有說其他模型不行。 ...