OPPO AI Agent团队质疑我们距离真正有用的深度研究代理还有多远 介绍FINDER,一个包含100个人工策划研究任务的新基准,以及DEFT,深度研究代理的第一个失败分类法。