トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
分散型AIコンピューティングにおけるデータ検証:分散環境における完全性を確保するための3つのアプローチ
@OpenledgerHQ、@gensynai、@OpenGradient
分散型AIコンピューティングは複数の参加者がデータや計算を共有する構造であるため、信頼を確保する方法は、中央サーバーに依存する既存の方法よりも重要な課題となっています。この点で、OpenLedger、Gensyn、OpenGradientは、データ、学習、推論の異なる段階での検証を担当するプロジェクトとして紹介されています。
Gensynは、世界中に散らばるアイドルコンピューティングリソースを集めてAIモデルを訓練する分散学習ネットワークを目指しています。通信が遅く、デバイス性能が異なる環境でも学習を可能にするために、NoLoCoのような低通信学習手法やCheckFreeのような故障回復技術が提案されています。同時に、Verdeプロトコルを通じて訓練計算が正しく行われたかを検証し、結果が異なる場合は、訓練全体をやり直さずに特定の操作ステップのみを再実行して判断する構造を用いています。これを実現するために、RepOpsライブラリを用いて決定性を強制し、異なるハードウェア上で同じ計算結果が得られるようにします。しかし、この検証は特定の入力に対する計算の正確性を確認するものであり、訓練に使用されるデータが事前に汚染されているかどうかを自動的に判断するものではありません。
OpenLedgerは、トレーニングに使われるデータ自体の起源と変更履歴の追跡に焦点を当てています。データ貢献者は、あらかじめ決められた形式でファイルをDatanetに提出し、これらの貢献はチェーン上で記録されるため、どのバージョンでいつ、どのデータが使われたかを確認できます。ファイルサイズとアップロード頻度を制限し、承認やバージョン管理のプロセスを経て、無差別なデータ流入を減らすことを目的としています。質の高い評価やステーキングに基づく罰則を通じて悪意あるまたは重複的な寄付を抑制する構造が説明されており、その目的はデータ貢献の説明責任と追跡可能性を確保することにあることを明確にしています。
OpenGradientは、モデルが訓練後に推論を実際に行った際にプロセスが正しく実行されたかどうかを検証する責任があります。推論結果を暗号学的またはハードウェアベースの証明として残し、グラディエント台帳に記録して後で監査できるようにしましょう。パフォーマンス負荷を軽減するため、重い計算はオフチェーンで並列処理され、オンチェーンのみの結果と証明は検証されます。検証方法はZKMLで、高い保証を提供しますが計算コストは高いです。TEEはハードウェア信頼を前提とし、ほとんどパフォーマンス負荷がありません。バニラ方式は検証を省略します。
これら3つのプロジェクトを組み合わせると役割の分担が明らかになります。OpenLedgerは入ってくるデータを記録し、Gensynはそのデータを用いた計算レベルで正しく訓練が行われたか、OpenGradientは訓練済みモデルが正しく推論を行ったか検証します。しかし、2026年1月時点でこれらの段階は単一の正式な技術パイプラインでつながっておらず、データソースの証明、学習検証、推論検証を連続的な証明チェーンに結合する標準は提案されていません。
最終的に、現在の分散型AIデータ検証は、「すべてを一度に保証するシステム」ではなく、データ記録、学習、計算検証、推論検証といった異なる層のデバイスが明確な役割と制限を伴い並行して発展している状態と理解できます。
$OPEN



トップ
ランキング
お気に入り
