Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Šokováno 🤯, že vlastní schopnosti Composer2 kurzora skutečně převyšovaly opus4.6? 🧶👇
📊 Základní benchmarky (odmítání být spokojený)
• Terminal-Bench 2,0: 61,7 % (tvrdý a překonal Claude Opus 4,6 o 58,0 %)
• SWE-bench vícejazyčnost: 73,7 %
• CursorBench: 61,3 % (oproti 44,2 % v předchozí generaci)
Vidím spoustu lidí, kteří si stěžují, že CursorBench je ukazatel "Věř mi, kámo"
Ale oficiální je velmi tvrdý: Terminal-Bench používá benchmarky třetí strany Laude Institute a oficiální rámec Harbor provedl 5 kol pro měření průměrů a data jsou velmi solidní.
Chceš mě donutit zaplatit znovu? 😂😂🫰🫰
Top
Hodnocení
Oblíbené
