El equipo de agentes de IA de OPPO cuestiona hasta qué punto estamos de ser realmente útiles para Agentes de Investigación Profunda Presentamos FINDER, un nuevo benchmark con 100 tareas de investigación seleccionadas por humanos, y DEFT, la primera taxonomía de fallos para agentes de investigación profunda.