驚きました🤯か?カーソル自身のモデルComposer2のコーディング能力が実際にopus4.6を超えていたのですか? 🧶👇 📊 コアベンチマーク(自己満足を拒否) ・ターミナルベンチ2.0:61.7%(硬直し、クロード作品4.6を58.0%上回るパフォーマンス) ・SWEベンチ多言語者:73.7% • CursorBench:61.3%(前世代の44.2%から) 多くの人がCursorBenchを「信じてくれ」と文句を言っているのを見かけます しかし、公式の方は非常に厳格です。Terminal-BenchはサードパーティのLaude Instituteのベンチマークを使い、公式のHarborフレームワークは平均を5回実施しており、データは非常に堅実です。 また払わせるつもりか? 😂😂🫰🫰