Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Alex Albert
Claude Relations @AnthropicAI. Názory jsou mé vlastní!
Opus 4.5: 7.5-8/10 užitečné.
Konečně tomuto modelu důvěřuji, že za mě píše, a má skutečně dobrý úsudek a vkus v tom, co je důležité.
Co se týče programování, působí to, že to může fungovat navždy a nezaseknout se ve stejných kódovacích smyčkách jako předchozí modely.
Některé věci stále nejsou dokonalé: paměť, používání počítače, tvorba dokumentů, proaktivita atd., ale je jasné, že se na nich zlepšují (i zde jsou potřeba některé inovace v produktovém UX).
V tuto chvíli mám pocit, že jsme jen pár generací modelů od toho, abychom se přiblížili k 10/10 pro mě.

Alex Albert16. 1. 2025
Claude 2: přepsal mi pár e-mailů, vyčistil gramatiku v dokumentaci. 1,5/10 užitečné.
3 Opus: první model, se kterým jsem měl pocit, že mohu inteligentně komunikovat, pomohl mi s drobným kódováním/skriptováním. 3/10 užitečné.
3.5 Sonet: začal jsem experimentovat s end-to-end programátorskými projekty, možná občas nějaké životní rady. 4/10 užitečné.
Nový 3.5 Sonet: většinou jsem v programování lepší než já, spousta životních rad/poradenství, první model, kterému důvěřuji s doporučeními ohledně zdraví/kondice, používám více image in/multimodal, u většiny pracovních úkolů se k němu obracím nejdřív. 5,5/10 užitečné. S externími integracemi (MCP atd.) je to asi 6,5/10 užitečné.
Tento vývoj nastal během zhruba jednoho roku, což je neuvěřitelné. 10/10 užitečný na tomto měřítku by byl v podstatě nesmírně moudrý a znalý životní asistent se vším kontextem o vás a vašich aktivitách. Brzy tam dorazíme.
184,73K
Skvělá recenze Opus 4.5
>"Stručně: Je to Sonet 3.5 roku 2025. Zkus to. Udělej to hned"

Cooper29. 11. 2025
Claude Opus 4.5: kompletní recenze
Toto je nejlepší vydání modelů za dlouhou dobu, pokud jde o programování. Je mi neuvěřitelné, jak je to dobré. Od původního vydání GPT-4-0314 jsem neviděl tak velké zlepšení
Hlavní zlepšení je, že konečně přišli na to, jak správně 'myslet'.
Už nedělá hrůzné logické chyby ve svém myšlení.
Problémy jako "Dobře, teď udělám testy. <Testy selžou> Skvělé! Testy projdou." už neexistují.
To se zobecňuje prakticky na VEŠKEROU logiku, pokud jde o přemýšlení o kódu – extrémně zřídka, pokud vůbec, dělá chyby.
Další velký milník: Už nepíše nekvalitní kód! To je obrovské. S Codexem můžete psát kód, který funguje. Ale píše hrozný kód – zbytečné funkce, špatné abstrakce atd. To je na nic, protože to funguje krátkodobě, ale dlouhodobě se model dostane do slepé uličky, kdy už nebude schopný pracovat s kódem, který sám napsal.
U Opusu to tak není. Nejenže píše elegantní kód, ale také umí refaktorovat slop kód na neslop kód. Hluboce rozumí kódu a dokáže najít elegantní řešení, která nejsou jen "mechanickými" refaktory.
Je velmi autonomní a nezávislý. Sám o sobě, když narazí na problémy, vytvoří jen minimum reprodukovatelných příkladů, pokusí se rozdělit odkud chyba pochází, a pak ji opraví, aniž by se zasekl v králičích norách. I když je chyba v nějaké nesouvisející části kódu – v kódu, který si ani sám nenapsal!!
A také DĚLÁ PŘESNĚ TO, CO ŘÍKÁTE, BEZ ZKRÁCENÍ! To je obrovské!! Používání Kodexu je v podstatě hra na "udeř krtka", kde chápe, co chcete, aby udělal, ale je to příliš těžké, takže se odměnou hackuje do špatného řešení, které nechcete.
Opus se skutečně pouští do problému a řeší ho správně, i když je to těžké.
Dlouhé pochopení kontextu je prakticky dokonalé. Ve spojení s mechanismem kompaktace, který je ve výchozím nastavení dostupný v Claude Code, můžete vést nekonečně dlouhý rozhovor, kde rozumí všemu uvnitř bez jakéhokoliv zhoršení.
Co se týče návrhu, výzkumu, přicházení s novými nápady. Je to lepší, ale není to úplně úroveň experta na úrovni člověka. Může navrhovat řešení, která bych považoval za dobrý design, ale zatím úplně neumí 'myslet s portály'. Přesto to bylo dobré zlepšení oproti tomu, co jsme měli předtím, kdy prakticky neexistovalo.
Vše výše jsem zjistil testováním v posledních dnech, kdy úkolem je napsat interpreter pro jazyk, který jsme navrhovali za běhu. Je to velmi specializovaný design, podobný Self a Smalltalk, jen jazyk stavíme přímo v něm. To vede k extrémně obtížným situacím, kdy se snažíte definovat, jak funkce fungují – uvnitř jazyka – a přitom ještě funkce nemáte! A přesto odvádí skvělou práci. Někdy ani úplně nechápu, co po něm chci, ale Opus ano a dělá to dobře.
TL; DR: Je to Sonet 3.5 roku 2025. Zkus to. Udělej to teď
180,52K
Top
Hodnocení
Oblíbené
