熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
在經過一週對 Gemini 3 非常正面反應的沉澱後,我有足夠的時間實際每天使用這個應用程式幾天,並對提供一些評價感到自信。我的重點更多是從消費者的角度出發,而不是其他方面。在商業方面會有很多利基市場,某些模型比其他模型更有意義,但在消費者方面,我基本上假設遊戲已經結束,ChatGPT 獲勝。消費者 AI(主要是知識檢索)是否有可能翻轉,Google 重新領先?這會變得高度雙頭壟斷嗎?甚至會更加分散嗎?讓我們來探討一下。
我之前在 iOS 上使用過 Gemini 應用程式,但基本上只是作為訪問 Veo 3 的方式。在過去的一週裡,我轉而每天使用這個應用程式,將我所有的常見問題都通過它進行處理。結果是每天在應用程式中花了大約 15 分鐘(大約與我歷史上在 ChatGPT 中花的時間相同)。
這次體驗有很多值得喜歡的地方。我覺得 Gemini 3 在“調整”其回應方面做得很好。有些問題只需要幾個要點,而其他問題可能需要幾段文字才能滿意地回答。ChatGPT 在這方面已經變得更好了,但 Gemini 在這裡感覺像是向前邁進了一步。結果也比 ChatGPT 感覺更快。我希望能量化這一點,以進一步了解差距,但它感覺更快。這很可能與 ChatGPT 中模型選擇的學習行為有關。我傾向於過度依賴 GPT-5 Pro,而我應該更常使用 Thinking。
Nano Banana Pro 是另一個強大的區別因素。它確實能以完全不同的水平處理複雜的圖像和大量文本。它的速度也非常快。生成圖像和視頻仍然是吸引我進入 Gemini 應用程式的最可靠方式。
不過,它並不完美,還有很多粗糙的地方,超出了我對一個已經成為他們策略核心的 Google 產品的期望。我覺得這個應用程式在維持與伺服器的連接方面做得相當糟糕。我經常會遇到奇怪的“斷開連接”錯誤,並且需要重新提交查詢。
此外,語音轉錄模式(我在 ChatGPT 中不斷使用)真的很糟糕。它經常錯過你按下按鈕後說的前幾個字,然後經常會中斷你並提前提交你的提示,無論你喜不喜歡。在 ChatGPT 中,你可以選擇結束語音錄音並在發送之前預覽文本。我還沒有弄清楚如何在 Gemini 中做到這一點。我真的希望他們能改善這個功能,這對我來說是目前最大的障礙。
我遇到的最後一個“缺點”是切換不同模式之間的困難。如果我使用 Nano Banana 生成一個圖像,我似乎會被困在某種圖像流程中,無法回到僅僅向 Gemini 3 提問的狀態。這讓我覺得不同的模型並不統一,這很奇怪,因為我總是聽到很多關於“多模態”的討論。也許這只是 UI 錯誤,但我覺得在文本和圖像之間來回切換將是一個殺手級的功能。“告訴我關於主題” ➜ “現在可視化那個主題。”
我想我會在可預見的未來繼續在 AI 應用程式之間跳來跳去,但我想知道消費者是否會普遍這樣做。如果 Google 沒有那麼多產品表面可以連接到 Gemini,我會相當懷疑,因為 ChatGPT 在這一點上已經與“AI”同義,而更好的模型不會改變這一點。
在我個人經歷過的 ChatGPT 聚合器論點中,最大的脆弱性,至少在我切換後,便是意識到許多“鎖定”策略迄今為止並未成功。我並不想念我以前的聊天記錄,我並不覺得缺乏個性化,我也沒有留下與真實人員的聯繫網絡。這些功能可能會成熟,但我覺得核心內容,即打開 AI 應用程式的主要原因,與社交網絡的真正鎖定情況相比,實際上一樣好,甚至更好。
顯然,Google 對消費者 AI 非常重視,並且只需幾個 UI 修正就能擁有最佳產品。問題是 DAU 和用戶使用時間究竟會多快增長。我預期這裡的每一個圖表和數據點都會被分析到死,因為基礎模型戰爭仍在激烈進行。
我每個工作日都會寫這樣一篇短文。TBPN會在我們的每日通訊中發送它,還有標題、當天的嘉賓和當日的帖子。
註冊以便將其發送到您的收件箱。
76.57K
熱門
排行
收藏

