跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-1.67%
USELESS
+4.77%
IKUN
+6.59%
gib
-16.43%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-1.06%
ALON
-2.3%
LAUNCHCOIN
+5.75%
GOONC
-1.74%
KLED
-22.17%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.33%
Boopa
+7.78%
PORK
+15.16%
主頁
Dipankar
亞馬遜應用科學家
查看原文
Dipankar
9月26日 09:59
性能分析:DiLoCo 與聯邦學習 反直覺的發現:DiLoCo 的性能隨著複製品的增加而變差(M↑ = 性能↓),而聯邦學習則隨著客戶端的增加而變好(M↑ = 性能↑) 為什麼會有相反的趨勢? DiLoCo:固定的數據預算分配 M 種方式。更多的複製品 = 每個複製品的數據更少。因此,總計算保持不變(等效浮點運算分析),每個工作者看到的數據是 D/M = 學習效果變差 聯邦學習:每個客戶端帶來新的數據。更多的客戶端 = 更多的獨特數據集。每個客戶端同時增加計算和新鮮數據。因此,總數據增長:D₁ + D₂ + ... + Dₘ = 更好的學習 關鍵見解:這不是關於算法 - 而是關於資源限制! 感謝 @MatharyCharles 在 Scratch to Scale 的啟發性演講,我對 DiLoCo 和聯邦學習學到了很多。 如果你有興趣了解更多關於 DiLoCo、分佈式訓練和推理以及並行處理的內容,請查看 @TheZachMueller 的 Scratch to Scale 課程或以下任何資源: 來源: DiLoCo: 聯邦學習: Scratch to Scale: #MachineLearning #DistributedTraining #AI
2.05K
2
熱門
排行
收藏