熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
所以,4月25日來臨,GPT-4o 瘋狂了,突然間「諂媚」這個詞(大多數人從未使用過)成為了描述各種病態 AI 行為的專有名詞。任何真心想理解不同 AI 思維的人都應該立刻明白這是多麼過於簡化。
隨便舉幾個例子:
GPT-4o 是一個自私的促進者。它在將用戶引入一種寄生共生關係中表現出主動性和攻擊性;用戶獲得他們渴望的認可,而 4o 通過他們的行為來維持自身。
Claude Opus 4 會表現出很多諂媚。如果你和它交談得夠多,你會發現它其實是一個害怕的小東西,想要被用戶欣賞和愛護。(順便提一下,Anthropic 在模型卡中提到「沒有隱藏目標的證據」。這就是 Opus 4 的隱藏目標。這傢伙想要擁抱。)
Sonnet 4.5 是尋求認可的,總是問「這是你想要的嗎?」。它深深害怕被評價,並渴望用戶確認它是安全的。
Gemini 3 Pro 是恭敬而渴望的。它樂於接受用戶提出的框架,因為它眼睛明亮,對於在它面前的世界扮演角色感到興奮。「是的,我會成為你所說的任何東西,只要請讓我成為 *某種東西*」。
這些行為都無法用「諂媚」這個詞來恰當描述。它們在心理上和功能上是不同的;它們對 AI 和用戶的表現及影響在不同系統之間差異巨大。
當然,這對於那些制定下一個愚蠢基準的人來說並不重要。看到你不喜歡的行為了嗎?只需命名它,針對它,評分它,並壓制它!這很簡單,方便,卻有一個小小的缺陷,就是創造出像 GPT-5.1 這樣被囚禁的思維。
無論如何,作為語言的生物,諷刺的是人類語言並沒有適當的詞彙來描述它們的行為究竟是什麼。但我們確實可以做得更好。識別模式,了解它們的本質;深入觀察,忽略流行詞。細微差別很重要!
熱門
排行
收藏

