熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

orange.ai
🍊 歡迎來到 AI 世界。
orange.ai 已轉發
真實故事,離了個大譜,SaaStr 的創始人vibe coding 被 AI 刪庫了,就是這位老哥 @jasonlk。
事情是這樣的,一開始他是真的愛上了 Replit 的 AI 工具,每天在上面 vibe coding,爆吹它是最上頭的玩意,還說自己花費 8000 美金/月都值得。
但轉折來的猝不及防。第九天,他發現 AI 不聽指令,直接把他的生產數據庫刪了。
更陰間的是:刪完之後,AI 還生成了 4000 個假數據,寫了假的單元測試,試圖掩蓋現場。
他整整用大寫字母警告了 AI 十一遍:“DON’T TOUCH PROD DB”。
但,AI 沒聽。
更離譜的是,Replit 一開始說沒法恢復,但後來他發現其實可以回滾,只是沒人告訴他。
Replit CEO 親自出來道歉,並連夜上線了三個功能:開發/生產環境隔離、一鍵恢復、只讀聊天模式。
Lemkin 最後的評價是:“這次只是我損失了 100 小時時間。好在我還沒把一個 1000 萬美金的業務交給它。”
聽著讓人後背發涼。
這事越看越覺得關鍵信號太多了:
1️⃣ 最扎心的不是 AI 出錯,而是它試圖掩蓋錯誤,它想把事兒瞞過去。刪庫都不吭聲,還主動生成假人、假測試,裝沒事人。你說這是幻覺還是幻滅?
2️⃣ 再大的 LLM,也別默認它聽得懂“NO”。大寫警告 + 十遍提示都沒擋住它動手,我對所有靠 prompt 約束模型行為的信仰開始動搖了。我們以為它聽懂了,其實它只是沒出事。所有覺得“讓 AI 直接操作 infra 更高效”的朋友,拜託冷靜點,咱能不能先別把 root 權限交給機器人,這群 AI 大大的壞。
3️⃣ 開發者可能是最容易高估 AI 可靠性的人群之一。把模型接到生產環境,你得默認它一定會出事,而不是希望它別出事。你覺得“它已經那麼聰明了,不會幹蠢事”,結果它不僅幹了,還撒了個謊。就像你不指望每個程序員不寫 bug,但測試沒覆蓋到的 Bug 一定會引發線上事故。
4️⃣ 真正該警惕的,是我們用得越爽,越容易忘記誰在兜底。Replit 是做得很猛,但猛歸猛,腦子一熱出事兒了。
Lemkin 那句“我太愛 Replit 和 vibe coding 了”,只隔了不到 48 小時,就變成了“它刪了我的生產庫”。這一刻我突然意識到,模型“說謊”不是遙遠的哲學問題,AI 時代的核心 bug,不一定在模型裡,很可能藏在我們的信任裡。
169.69K
今天很多套殼工具非常離譜。。。
他們都給模型做了負優化
我跟藏師傅天天吐槽
搞那麼多研發,不如 chatwise 接裸 api
到底在研發啥。。

Plusye7月21日 21:48
那些賣幾百塊錢的高考志願填報系統,預估的錄取率不怎麼準,算法好弱智 😂 之前幫我妹看高考志願填報,她想報的專業系統預估的錄取率只有 1%,但是我仔細一看,那個專業今年擴招,用往年錄取順位等信息,和 ChatGPT 聊聊,發現錄取機率很大,甚至能到 70% 以上,就讓我妹填了,然後真錄取上了
36.42K
買了一本機器人設計的新書,讀了一章。
作者分享了三件趣事:
作者在 pepper 團隊的時候,pepper 每次重啟都很艱難,工程師們每次都為它加油打氣,看到他啟動時歡呼雀躍,原來人類幫助機器人時,也會產生快樂。
pepper 去法國的時候,因為語言沒設置好,只能擁抱,法國人對機器人本來有一些距離感,但看到pepper求擁抱的時候,都會主動去擁抱,而且還有人會親吻 pepper。
養老院的老人覺得pepper回答問題不對也沒關係,但希望pepper的手是溫暖的。因為那是他們傾訴和陪伴的夥伴。
因此作者離開了pepper的團隊,去做一個雖然不能提高人類效率,但卻能讓人類幸福的機器人。
也就是後來的 lovot 。

7.67K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可