A Equipe de Agentes de IA da OPPO questiona o quão longe estamos de Agentes de Pesquisa Profunda realmente úteis Apresentando o FINDER, um novo benchmark com 100 tarefas de pesquisa curadas por humanos, e o DEFT, a primeira taxonomia de falhas para agentes de pesquisa profunda.