Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Zaskoczenie🤯, model Composer2 od Cursor ma zdolności kodowania, które podobno przewyższają opus4.6?🧶👇
📊 Kluczowe testy porównawcze (bez samouwielbienia)
• Terminal-Bench 2.0: 61.7% (twardo i przewyższa Claude Opus 4.6, który ma 58.0%)
• SWE-bench Multilingual: 73.7%
• CursorBench: 61.3% (w porównaniu do poprzedniej generacji 44.2%)
Widzę, że wiele osób narzeka, że CursorBench to wskaźnik "Zaufaj mi, bracie"
Ale oficjalnie jest bardzo solidnie: Terminal-Bench korzysta z benchmarku trzeciej strony Laude Institute, a oficjalny framework Harbor przeprowadził 5 rund i wziął średnią, dane są bardzo solidne.
Czy znów zmuszą mnie do płacenia? 😂😂🫰🫰
Najlepsze
Ranking
Ulubione
