目前关于 TPU 和 $GOOG 的几个想法 第一:拒绝无效的参数对标 别再争论 GPU TPU参数相差多少、迁移成本有多高,谁更牛逼。这有啥意义? $GOOG 本来就不是半导体公司,TPU 也不是准备到处去卖的商品。 他们近十年前就开始布局并完全是为了服务于自己的业务。这玩意儿他们自己用都不够,哪有空卖给你? 这就像亚马逊搞物流一样,是为了自己快,而不是为了卖卡车。 同理,这也不能用来 FUD $nvda 达子卖卡的, $goog 不卖卡,怎么比?你用这个FUD 达子很不合理。 第二:Gemini 的核心是“工业化能力” 大家都在卷模型本身牛不牛逼,但忽略了商业落地更重要的一点:成本与速度(Unit Economics)。 Gemini 的体验告诉我,Google 正在利用 TPU 的原生优势,将 AI 推理的成本打到地板价,同时保持极低的延迟。 如果 AI 在未来成为一种“基础设施”,对于 95% 的用户场景(查资料、写邮件、做摘要),“好用、便宜、实时响应” 远比 “极其聪明但反应迟钝” 重要。 请注意,以上是一种对于未来的假设,AI 乾坤未定,没有人知道其未来究竟应该是一种什么形态。 $GOOG 就像是当年的福特或丰田。 他们引入了流水线(TPU集群),打造了软硬一体的精益产线(JAX/液冷),把汽车变成了家家户户买得起的寻常物,而不是诞生之初的富人奢侈品。 最后: 我没有说 $NVDA 不好,也没有说其他模型不行。 ...