熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
代幣化只是一種特殊的「分塊」情況——將低層次數據構建成高層次抽象——這反過來又是智能的基礎。
我們的新架構,能夠實現層次化的*動態分塊*,不僅無需分詞器,而且擴展性更佳。


7月12日 00:06
標記化一直是實現真正端到端語言模型的最後障礙。
我們開發了 H-Net:一個層次化網絡,將標記化替換為模型內部的動態分塊過程,自動發現並操作有意義的數據單元。
這對我來說是一個非常重要的項目——我想解決它已經好多年了,但不知道該怎麼做。這一切都是 @sukjun_hwang 和 @fluorane 的驚人工作!
我寫了它發展的故事,以及接下來可能會發生的事情。
H-Net:
194.7K
熱門
排行
收藏