Löjligt. Kommer du att utvärdera en AI-agents prestation utifrån hur många verktygssamtal den gjorde?