OPPO AIエージェントチームが、真に有用なディープリサーチエージェントからどれほど遠いのかを問い直す FINDERを導入します。これは人間が厳選した100の研究タスクを含む新しいベンチマークであり、ディープリサーチエージェント向けの初の失敗分類法であるDEFTです。