熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
Philip Clark (@PJClark),Thrive Capital (@ThriveCapital) 的合夥人,根據他在 OpenAI、Cursor、Physical Intelligence 的投資以及他的半導體背景,概述了 AI 發展狀態的三個重要啟示:
1.) AI 的突破不是線性的。它們像矽一樣以架構波的形式出現。
Philip 的半導體類比將 AI 的進步重新框架為一系列類似硬體的範式轉變。
當一條路徑達到極限(單核 → 多核;預訓練 → 後訓練)時,新的架構會出現。AI 不是通過增量調整來演變的,而是通過結構性重塑來推進。
2.) 強化學習是下一個架構時代(目前)
Philip 將強化學習框架為後訓練的繼任者:一個新的基礎,而不是優化。但他強調,這不會是最後一個。
就像硬體不斷從單核跳躍到多核再到 GPU,AI 將經歷多次範式波,每次都解鎖新的性能上限。強化學習只是下一波,而不是最後一波。
3.) OpenAI 的護城河不是模型,而是其不斷發現下一個範式的能力。
Philip 認為核心優勢在於產品的上游:大型模型中的每一個主要架構突破都源自 OpenAI。
他們的防禦能力來自於不斷發明“下一件事”,同時將前一件事運營化……這在任何行業中都是一種罕見的組合,更不用說在一個以不連續跳躍為特徵的行業中。
. . .
Molly: "自豪地贊助 Sourcery 的贊助商之一是 @turingcom,因此我接觸到了 AI 研究方面的事情——一個 AI 研究加速器 [我們已經採訪了 CEO,@jonsidd]。他們幫助處理模型。目前,他們注意到在過去一兩個季度中,從模仿數據和合成數據到強化學習的嚴重轉變。
所以我很好奇你在技術方面以及應用方面是如何看待的?"
Philip: "我認為 AI 在某種程度上有點像半導體——如果我可以回到半導體這個偉大的基準。在我們試圖獲得更好性能的過程中,有許多波動。
你知道,對於半導體,我們曾經有單核半導體。然後我們基本上無法從單核中榨取更多,因此我們轉向了多核。然後我們轉向了 GPU。我認為我們在 AI 中看到的情況非常相似,我們從 GPT-1、GPT-2、GPT-3 時代的預訓練開始。這使我們達到了 GPT-4。
然後我們開始使用許多後訓練技術來進行 ChatGPT——監督微調、強化學習與人類反饋。這使得模型不再是外星智慧,而是更有幫助的助手。現在,隨著這些增益的低懸果實已經被榨取(儘管可能還有很多工作要做),強化學習已成為 AI 中下一個重要的範式轉變,並且許多資源都在這裡。...
熱門
排行
收藏

