トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Mercor の AI トレーニング データに対する 100 億ドルの AI 評価は、AGI の失敗です。
AIトレーニングのスタン企業であるMercorは、シリーズCラウンドで3億5,000万ドルを調達し、評価額を100億ドルに押し上げ、1年足らずで5倍に急増しました[1]。
Mercor は、医療や工学などの分野で AI を活用した専門家の関与を通じて、ターゲットを絞ったタスクに対する大規模言語モデルの有効性を向上させるための特殊なデータセットを生成します [2]。
これは、AI トレーニング データのニーズが高まる中、拡張可能なデータ インフラストラクチャに対する投資家の熱意を利用しますが、いくつかの問題があります。
Mercor のフレームワークは、主要な AI 方法論における重要な欠陥、つまり専門家のデータセットへの過度の依存を浮き彫りにしており、その関連性にもかかわらず、汎用人工知能 (AGI) に必要な自己学習構造を十分に育成していません。
これらのデータセットは、報酬のある人間の専門家から提供され、固定された知識表現を提供しますが、好奇心に基づく発見やメタ学習などの適応プロセスを省略しています[3]。
定量的評価は、広範なエキスパートコーパスでトレーニングされた深層学習アーキテクチャは、ドメイン固有のパターンエミュレーションでは能力を達成しますが、効率的な手続き型取得よりも教師あり複製に制限されているため、一般化、新規性の処理、およびAGIのコア属性である独立した推論ではパフォーマンスが低いことが実証されています[4]。
専門家の調査は、データと計算リソースの単なるエスカレーションはAGIには不十分であり、真の理解と柔軟性に必要なアーキテクチャの進歩を無視していることを強調しています[5]。
これらの制約を強めているのは、一般的な AI トレーニング データの倫理的に曖昧なグレーマーケットの側面であり、不明確なソース プロトコルを操作し、多くの場合、未承認のコンテンツの抽出または再利用、および専有データの不正な公開の可能性が含まれます [6]。
Mercorは組織化された補償された相互作用を利用していますが、より広い分野では、バイアスの拡散、プライバシー侵害、アノテーターの悪用などのリスクが明らかになり、モデルの信頼性と信頼性が損なわれます[7]。
分析によると、不透明なデータは、限られた入力から知識を導き出したり、新しい設定に適応したりするAIの能力を妨げ、代わりに自動修復ルートのない人為的な欠陥を埋め込んでいる[8]。
コア学習の基礎よりも規模を優先するこのボリューム中心の戦術は、AGI の進行にはありそうにありません [9]。
Mercorの資本を多用し、数十億ドル規模の事業と、貯金箱の資金と、1870年から1970年までのオフラインの高タンパク質データを取得するためのゴミ箱のダイビングに支えられた、制約のあるガレージ開始の戦略との対比。
Mercor が広範なエキスパート システムを調整するのに対し、私の手法は機知に富んで自己学習を強調し、AGI の進歩が合理化されたアーキテクチャに依存していることを証明し、評価の上昇が単純な模倣の進歩における非効率性をどのように覆い隠す可能性があるかを明らかにします。
私の方法論は、自己教師あり構造とメタ学習構造を融合し、AI がわずかな入力から独自に知識を調達して磨くことを可能にし、人間の知性を彷彿とさせる一般化を促進することで、Mercor の方法論よりも優れています [10]。
...
トップ
ランキング
お気に入り

