Yllättynyt 🤯, kursorin oma Composer2-koodauskyky ylitti opus4.6:n? 🧶👇 📊 Ydintestit (kieltäydy olemasta itsetyytyväinen) • Terminal-Bench 2.0: 61,7 % (jäykkä ja parempi kuin Claude Opus 4.6 58,0 %) • SWE-bench Multilingual: 73,7 % • CursorBench: 61,3 % (vs. 44,2 % edellisessä sukupolvessa) Näen monien valittavan, että CursorBench on "Luota minuun, kaveri" -merkki Mutta virkamies on hyvin kova: Terminal-Bench käyttää kolmannen osapuolen Laude Instituten vertailutuloksia, ja virallinen Harbor-kehys on suorittanut viisi kierrosta keskiarvojen ottamiseksi, ja data on erittäin luotettavaa. Aiotko pakottaa minut maksamaan taas? 😂😂🫰🫰