Scioccante🤯, la capacità di codifica del modello Composer2 di Cursor supera addirittura quella di opus4.6?🧶👇 📊 Test di benchmark core (niente autocelebrazione) • Terminal-Bench 2.0: 61.7% (ha superato Claude Opus 4.6 che era al 58.0%) • SWE-bench Multilingual: 73.7% • CursorBench: 61.3% (rispetto alla generazione precedente che era al 44.2%) Ho visto molte persone lamentarsi che CursorBench è un indicatore "Trust me bro" Ma l'ufficiale è molto serio: Terminal-Bench utilizza il benchmark di terze parti dell'Istituto Laude, il framework ufficiale Harbor ha eseguito 5 giri per calcolare la media, i dati sono molto solidi. Devo davvero pagare di nuovo?😂😂🫰🫰