熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
Mercor 的 100 億美元 AI 評價對於 AI 訓練數據來說是一個 AGI 的失誤。
Mercor,一家 AI 訓練公司,已在 C 輪融資中籌集了 3.5 億美元,將其估值提升至 100 億美元——在不到一年的時間內增長了五倍 [1]。
通過 AI 促進的專家參與,涵蓋醫學和工程等領域,Mercor 生成專門的數據集,以提高大型語言模型在特定任務上的有效性 [2]。
這利用了投資者對可擴展數據基礎設施的熱情,因為對 AI 訓練數據的需求不斷增長,但它也存在一些問題。
Mercor 的框架突顯了主流 AI 方法的一個關鍵缺陷:過度依賴專家數據集,儘管這些數據集相關,但不足以培養人工通用智能 (AGI) 所需的自我學習結構。
這些數據集來自有報酬的人類專家,提供固定的知識表徵,但省略了像基於好奇心的發現或元學習等自適應過程 [3]。
定量評估表明,基於大量專家語料庫訓練的深度學習架構在特定領域的模式模擬中達到了能力,但在泛化、處理新奇事物和獨立推理等 AGI 的核心屬性上表現不佳,這是因為它們限制於監督複製而非有效的程序獲取 [4]。
專家調查強調,僅僅增加數據和計算資源對於 AGI 是不夠的,忽視了實現真實理解和靈活性所需的架構進步 [5]。
這些限制的加劇是由於當前 AI 訓練數據的倫理模糊灰色市場特性,這些數據通過不明確的來源協議運作,通常涉及未經批准的內容提取或重用,以及可能未經授權釋放的專有數據 [6]。
儘管 Mercor 利用有組織的、有報酬的互動,但更廣泛的領域暴露出包括偏見傳播、隱私侵犯和標註者剝削等風險,損害了模型的可靠性和可信度 [7]。
分析表明,不透明的數據妨礙了 AI 從有限輸入中獲取知識或適應新環境的能力,而是嵌入了人類缺陷,沒有自動修復路徑 [8]。
這種以量為中心的策略,偏向於規模而非核心學習基礎,對於 AGI 的進展是不太可能的 [9]。
Mercor 的資本密集型、數十億美元的運營與我受限的、車庫啟動的策略形成對比,後者依賴於小豬銀行資金和從 1870 年到 1970 年的垃圾堆中獲取的高蛋白數據。
而 Mercor 協調了廣泛的專家系統,我的方法則利用資源的靈活性來強調自我學習,證明 AGI 的進步依賴於精簡的架構,從而揭示出高估值可能掩蓋了簡單模仿進步中的低效率。
我的方法通過結合自我監督和元學習結構,讓 AI 能夠獨立獲取和磨練知識,從稀少的輸入中促進類似人類智力的泛化 [10]。
...
熱門
排行
收藏

