この論文は、より多くのデモでエージェントを拡大することが行き止まりであることを示しています。 EvoCUAはシンプルだが不快な主張をしています。コンピュータ使用エージェントが失敗するのは「賢くないから」ではない、ということです。 失敗するのは、学習者ではなくオウムのように訓練されているからです。 ほとんどのGUIエージェントは静的トレースをコピーします。これは短い作業には効果があります。計画や回復、判断が必要な瞬間に崩れ去ります。 EvoCUAはデータのスケーリングから体験スケーリングへのパラダイムをひっくり返します。 スクリーンショットやスクリプトを集める代わりに、閉じたループを作っています。 • タスクを自動的に統合する • 実行可能な検証ツールの付与(あいまいな報酬なし) • 大規模な並行サンドボックス展開 ・成功と失敗の軌跡を比較する • 効果的な点を強化し、壊れた点を書き直す ここで失敗はノイズではありません。 それらは最も価値の高い信号です。 モデルはどこで間違えたのか、なぜか、どう直すかを学び、その修正を内面化します。 これは重要な点で、GUIエージェントは境界で死んでしまいます: 予期せぬUI状態 長期的ワークフロー タイミング、順序、回復エラー ...