熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
@flappyairplanes 的共同創辦人稱當前的強化學習模型訓練範式為「環境雜亂」。他們解釋道:
「今天的強化學習範式驚人地低效。你在任務之間幾乎沒有什麼泛化,你通過一種學習方式教導模型,然後再教導它下一種。這有點像打地鼠。我們看著這一切,覺得這有點瘋狂。下一個 AI 的範式不會是環境雜亂。」
「人類水平的智慧並不是上限,而只是可能性的底線。如果你能用更少的數據和可能更多的計算能力以非常不同的方式訓練模型,那會發生什麼?我們其實不知道。但我確實認為它們會是不同的、奇怪的,並且會擁有我們會發現非常有價值的有趣能力。」
熱門
排行
收藏
