Команда OPPO AI Agent задается вопросом, насколько мы далеки от действительно полезных агентов глубоких исследований. Представляем FINDER, новый эталон с 100 задачами для исследований, отобранными людьми, и DEFT, первой таксономией неудач для агентов глубоких исследований.