Tim Agen AI OPPO mempertanyakan seberapa jauh kita dari Agen Riset Mendalam yang benar-benar berguna Memperkenalkan FINDER, tolok ukur baru dengan 100 tugas penelitian yang dikuratori manusia, dan DEFT, taksonomi kegagalan pertama untuk agen penelitian mendalam.