也许这是AI代理第一次接受绩效评估?我们刚刚发布了这个 @cognition - 有大量有趣的现实世界示例和指标,展示客户如何使用代理,以及仍然存在的局限性。