Zaskoczenie🤯, model Composer2 od Cursor ma zdolności kodowania, które podobno przewyższają opus4.6?🧶👇 📊 Kluczowe testy porównawcze (bez samouwielbienia) • Terminal-Bench 2.0: 61.7% (twardo i przewyższa Claude Opus 4.6, który ma 58.0%) • SWE-bench Multilingual: 73.7% • CursorBench: 61.3% (w porównaniu do poprzedniej generacji 44.2%) Widzę, że wiele osób narzeka, że CursorBench to wskaźnik "Zaufaj mi, bracie" Ale oficjalnie jest bardzo solidnie: Terminal-Bench korzysta z benchmarku trzeciej strony Laude Institute, a oficjalny framework Harbor przeprowadził 5 rund i wziął średnią, dane są bardzo solidne. Czy znów zmuszą mnie do płacenia? 😂😂🫰🫰