Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Dziś zorganizowałem wyścig między dwoma robotami.
Mój Mac po lewej stronie vs Claude Code po prawej. Oba miały za zadanie stworzyć aplikację płatniczą na nowym blockchainie Tempo od Stripe. Te same polecenia, to samo zadanie, obok siebie.
Opus 4.5 jest około 20% mądrzejszy od Qwen 35B w testach. I prawdopodobnie jest 50x większy. Zając powinien wygrać. Nie wygrał.
Lokalny model zakończył w 2 minuty. Claude zajął ponad 6. Poprosiłem Claude'a o ocenę obu wyników: lokalny model 6.5, Claude 4.5.
Dzięki 3x szybszym odpowiedziom mogłem dodać dodatkowy cykl: "skrytykuj plan i odpowiedz na krytyki." W czasie, gdy zając wciąż myślał, żółw przebiegł jeszcze jedno okrążenie.
Szybsze odpowiedzi oznaczają więcej rund poprawek przed zakończeniem spotkania lub rozproszeniem uwagi. W codziennych zadaniach szybsze modele mogą umożliwić ściślejsze pętle informacji zwrotnej.
Nie zawsze potrzebujemy najinteligentniejszej AI, aby wykonać zadanie.

Najlepsze
Ranking
Ulubione
