Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Terkejut 🤯, kemampuan pengkodean Composer2 model kursor sendiri benar-benar melebihi opus4.6? 🧶👇
📊 Tolok ukur inti (menolak untuk puas diri)
• Terminal-Bench 2.0: 61.7% (kaku dan mengungguli Claude Opus 4.6 sebesar 58.0%)
• SWE-bench Multibahasa: 73.7%
• CursorBench: 61.3% (vs. 44.2% pada generasi sebelumnya)
Saya melihat banyak orang mengeluh bahwa CursorBench adalah indikator "Percayalah bro"
Tapi pejabatnya sangat hardcore: Terminal-Bench menggunakan tolok ukur dari Laude Institute pihak ketiga, dan kerangka kerja resmi Harbor telah menjalankan 5 putaran untuk mengambil rata-rata, dan datanya sangat solid.
Apakah Anda akan memaksa saya untuk membayar lagi? 😂😂🫰🫰
Teratas
Peringkat
Favorit
