Šokováno 🤯, že vlastní schopnosti Composer2 kurzora skutečně převyšovaly opus4.6? 🧶👇 📊 Základní benchmarky (odmítání být spokojený) • Terminal-Bench 2,0: 61,7 % (tvrdý a překonal Claude Opus 4,6 o 58,0 %) • SWE-bench vícejazyčnost: 73,7 % • CursorBench: 61,3 % (oproti 44,2 % v předchozí generaci) Vidím spoustu lidí, kteří si stěžují, že CursorBench je ukazatel "Věř mi, kámo" Ale oficiální je velmi tvrdý: Terminal-Bench používá benchmarky třetí strany Laude Institute a oficiální rámec Harbor provedl 5 kol pro měření průměrů a data jsou velmi solidní. Chceš mě donutit zaplatit znovu? 😂😂🫰🫰