跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-1.67%
USELESS
+4.77%
IKUN
+6.59%
gib
-16.43%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-1.06%
ALON
-2.3%
LAUNCHCOIN
+5.75%
GOONC
-1.74%
KLED
-22.17%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.33%
Boopa
+7.78%
PORK
+15.16%
主页
Dipankar
亚马逊应用科学家
查看原文
Dipankar
9月26日 09:59
性能分析:DiLoCo 与联邦学习 反直觉的发现:DiLoCo 的性能随着副本数量的增加而变差(M↑ = 性能↓),而联邦学习随着客户端数量的增加而变好(M↑ = 性能↑) 为什么会有相反的趋势? DiLoCo:固定的数据预算分配为 M 份。更多的副本 = 每个副本的数据更少。因此,总计算保持不变(等效浮点分析),每个工作者看到的数据为 D/M = 学习效果更差 联邦学习:每个客户端带来新的数据。更多的客户端 = 更多的独特数据集。每个客户端同时增加计算和新数据。因此,总数据增长:D₁ + D₂ + ... + Dₘ = 学习效果更好 关键见解:这不是关于算法 - 而是关于资源限制! 感谢 @MatharyCharles 在 Scratch to Scale 的启发性演讲,我在 DiLoCo 和联邦学习方面学到了很多。 如果你对了解更多关于 DiLoCo、分布式训练和推理以及并行性感兴趣,请查看 @TheZachMueller 的 Scratch to Scale 课程或以下任何资源: 来源: DiLoCo: 联邦学习: Scratch to Scale: #MachineLearning #DistributedTraining #AI
2.05K
2
热门
排行
收藏