跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+8.26%
USELESS
-5.27%
IKUN
-6.9%
gib
+4.77%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-0.45%
ALON
-2.06%
LAUNCHCOIN
-10.05%
GOONC
-3.75%
KLED
-3.86%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.01%
Boopa
-3.76%
PORK
+0.15%
主页
Jessy Lin
博士@Berkeley_AI,访问研究员@AIatMeta。交互式语言代理 🤖 💬
查看原文
Jessy Lin
10月22日 02:09
作为我们最近在内存层架构方面工作的一个部分,我写下了我对持续学习问题的一些想法: 博客文章: 一些阐述超出了内存层的范围,所以我认为单独强调一下会很有用:
183.13K
1.07K
Jessy Lin
10月21日 23:48
🧠 我们如何为大型语言模型(LLMs)配备记忆,使其能够不断学习新知识? 在我们与 @AIatMeta 合作的新论文中,我们展示了如何通过稀疏微调记忆层来实现针对性的更新,以便进行持续学习,同时对现有知识的干扰最小化。 虽然完全微调和 LoRA 在保留任务性能上会出现剧烈下降(📉-89% FT,-71% LoRA 在事实学习任务上),但记忆层在遗忘方面的表现要好得多,学习的量相同但遗忘率仅为 -11%。 🧵:
284.95K
1.81K
热门
排行
收藏