Команда AI Agent OPPO ставить під сумнів, наскільки ми далеко від справді корисних агентів глибоких досліджень Представляємо FINDER — новий бенчмарк із 100 дослідницькими завданнями, кураторськими людиною, та DEFT — першу таксономію невдач для агентів глибоких досліджень.