Terkejut 🤯, kemampuan pengkodean Composer2 model kursor sendiri benar-benar melebihi opus4.6? 🧶👇 📊 Tolok ukur inti (menolak untuk puas diri) • Terminal-Bench 2.0: 61.7% (kaku dan mengungguli Claude Opus 4.6 sebesar 58.0%) • SWE-bench Multibahasa: 73.7% • CursorBench: 61.3% (vs. 44.2% pada generasi sebelumnya) Saya melihat banyak orang mengeluh bahwa CursorBench adalah indikator "Percayalah bro" Tapi pejabatnya sangat hardcore: Terminal-Bench menggunakan tolok ukur dari Laude Institute pihak ketiga, dan kerangka kerja resmi Harbor telah menjalankan 5 putaran untuk mengambil rata-rata, dan datanya sangat solid. Apakah Anda akan memaksa saya untuk membayar lagi? 😂😂🫰🫰