热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
在经历了一周对Gemini 3非常积极反应的观察后,我有足够的时间实际使用这个应用几天,并对提供一些评论感到自信。我的关注点更多是从消费者的角度出发,而不是其他方面。在商业方面会有很多细分市场,其中某些模型比其他模型更有意义,但在消费者方面,我基本上认为游戏已经结束,ChatGPT赢了。消费者AI(主要是知识检索)是否可能翻转,谷歌重新夺回领先地位?这会变得高度双头垄断吗?甚至可能更加分散?让我们来探讨一下。
我之前在iOS上使用过Gemini应用,但基本上只是作为访问Veo 3的一种方式。在过去的一周里,我切换到每天使用这个应用,将我所有的常见问题都通过它进行处理。结果是每天在应用上花费大约15分钟(大致与我在ChatGPT上花费的时间相同)。
这个体验有很多值得喜欢的地方。我觉得Gemini 3在“调整”其响应方面做得很好。有些问题只需要几个要点,而其他问题可能需要几段文字才能令人满意地回答。ChatGPT在这方面已经有所改善,但Gemini在这里感觉像是向前迈出了一步。结果也比ChatGPT更快。我希望能量化这一点,以进一步了解差距,但感觉更快。这很可能与ChatGPT中模型选择的学习行为有关。我倾向于过于依赖GPT-5 Pro,而我应该更常使用Thinking。
Nano Banana Pro是另一个强有力的区分因素。它确实以完全不同的水平处理复杂的图像和大量文本。它也非常快。生成图像和视频仍然是吸引我进入Gemini应用的最可靠方式。
不过它并不完美,有很多粗糙的地方,比我对一个已经成为他们战略核心的谷歌产品的期望要多。我觉得这个应用在维持与服务器的连接方面做得相当糟糕。我经常会遇到奇怪的“断开连接”错误,并不得不频繁重新提交查询。
此外,语音转录模式(我在ChatGPT中经常使用)也很粗糙。它经常会错过你按下按钮后说的前几个词,然后常常会在你不喜欢的情况下提前截断并提交你的提示。在ChatGPT中,你可以选择结束语音录制并在发送之前预览文本。我还没有弄明白如何在Gemini中做到这一点。我真的希望他们能改善这个功能,这对我来说是目前最大的障碍。
我遇到的最后一个“缺点”是切换不同模式之间的难度。如果我使用Nano Banana生成图像,我似乎会被困在某种图像流中,无法回到仅仅向Gemini 3提问的状态。感觉不同的模型并没有统一,这很奇怪,因为我总是听到很多关于“多模态”的讨论。也许这只是一个UI错误,但我觉得在文本和图像之间来回切换将是一个杀手级功能。“告诉我关于主题的事” ➜ “现在可视化那个主题。”
我想我会在可预见的未来继续在AI应用之间跳来跳去,但我想知道消费者是否会普遍这样做。如果谷歌没有那么多产品表面可以连接到Gemini,我会相当怀疑,因为ChatGPT在这一点上已经与“AI”同义,而一个更好的模型并不会改变这一点。
在我个人经历的ChatGPT聚合器理论中,最大的脆弱性,至少在我切换后,便是意识到许多“锁定”策略迄今为止并没有成功。我并不怀念我以前的聊天记录,我并不觉得缺乏个性化,我也没有离开一个与真实人建立的连接网络。这些功能可能会成熟,但我觉得核心内容,即打开AI应用的主要原因,依然一样好,甚至更好,这在具有真实锁定的社交网络中并不是这样。
显然,谷歌对消费者AI非常重视,经过一些UI修复后可能会拥有最好的产品。问题是DAU和用户使用时间究竟会多快增长。我预计在基础模型战争继续激烈进行的情况下,这里每个图表和数据点都会被分析得淋漓尽致。
我每个工作日都会写这样一篇简短的文章。TBPN会在我们的每日通讯中发送它,连同头条新闻、当天的嘉宾和当天的帖子。
注册以在您的收件箱中获取它。
76.57K
热门
排行
收藏

