在我们开始为人工智能开发编码 IDE 之前,我们可以先获取良好的数据。
pash
pash7月19日 09:58
我想指出,对于现实世界的任务(而非基准测试),Kimi K2 的表现优于 Gemini。 这是所有 @cline 用户的遥测数据,显示了不同的编辑失败率。注意 Kimi 的失败率约为 6%,这明显优于 Gemini 的 ~ 10% 错误率。 值得注意的是,Kimi 在本周的大部分时间里甚至超过了 Claude 4,达到了低于 4% 的失败率!
6.72K