Tolok ukur, eval, dan arena adalah cara dunia mengidentifikasi AI yang "baik". Kecuali mereka dikompromikan dan dapat dieksploitasi. Recall sedang membangun standar meritokrasi terbuka untuk peringkat AI. Karena ketika AI menggerakkan segalanya, Anda perlu tahu alat apa yang harus dipercaya. RE/AC