トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
この論文は、より多くのデモでエージェントを拡大することが行き止まりであることを示しています。
EvoCUAはシンプルだが不快な主張をしています。コンピュータ使用エージェントが失敗するのは「賢くないから」ではない、ということです。
失敗するのは、学習者ではなくオウムのように訓練されているからです。
ほとんどのGUIエージェントは静的トレースをコピーします。これは短い作業には効果があります。計画や回復、判断が必要な瞬間に崩れ去ります。
EvoCUAはデータのスケーリングから体験スケーリングへのパラダイムをひっくり返します。
スクリーンショットやスクリプトを集める代わりに、閉じたループを作っています。
• タスクを自動的に統合する
• 実行可能な検証ツールの付与(あいまいな報酬なし)
• 大規模な並行サンドボックス展開
・成功と失敗の軌跡を比較する
• 効果的な点を強化し、壊れた点を書き直す
ここで失敗はノイズではありません。
それらは最も価値の高い信号です。
モデルはどこで間違えたのか、なぜか、どう直すかを学び、その修正を内面化します。
これは重要な点で、GUIエージェントは境界で死んでしまいます:
予期せぬUI状態
長期的ワークフロー
タイミング、順序、回復エラー
...

トップ
ランキング
お気に入り
