Konyol. Apakah Anda akan mengevaluasi kinerja agen AI dengan berapa banyak alat yang dibuatnya?