Claude Opus 4.5: kompletní recenze Toto je nejlepší vydání modelů za dlouhou dobu, pokud jde o programování. Je mi neuvěřitelné, jak je to dobré. Od původního vydání GPT-4-0314 jsem neviděl tak velké zlepšení Hlavní zlepšení je, že konečně přišli na to, jak správně 'myslet'. Už nedělá hrůzné logické chyby ve svém myšlení. Problémy jako "Dobře, teď udělám testy. <Testy selžou> Skvělé! Testy projdou." už neexistují. To se zobecňuje prakticky na VEŠKEROU logiku, pokud jde o přemýšlení o kódu – extrémně zřídka, pokud vůbec, dělá chyby. Další velký milník: Už nepíše nekvalitní kód! To je obrovské. S Codexem můžete psát kód, který funguje. Ale píše hrozný kód – zbytečné funkce, špatné abstrakce atd. To je na nic, protože to funguje krátkodobě, ale dlouhodobě se model dostane do slepé uličky, kdy už nebude schopný pracovat s kódem, který sám napsal. U Opusu to tak není. Nejenže píše elegantní kód, ale také umí refaktorovat slop kód na neslop kód. Hluboce rozumí kódu a dokáže najít elegantní řešení, která nejsou jen "mechanickými" refaktory. Je velmi autonomní a nezávislý. Sám o sobě, když narazí na problémy, vytvoří jen minimum reprodukovatelných příkladů, pokusí se rozdělit odkud chyba pochází, a pak ji opraví, aniž by se zasekl v králičích norách. I když je chyba v nějaké nesouvisející části kódu – v kódu, který si ani sám nenapsal!! A také DĚLÁ PŘESNĚ TO, CO ŘÍKÁTE, BEZ ZKRÁCENÍ! To je obrovské!! Používání Kodexu je v podstatě hra na "udeř krtka", kde chápe, co chcete, aby udělal, ale je to příliš těžké, takže se odměnou hackuje do špatného řešení, které nechcete. Opus se skutečně pouští do problému a řeší ho správně, i když je to těžké. Dlouhé pochopení kontextu je prakticky dokonalé. Ve spojení s mechanismem kompaktace, který je ve výchozím nastavení dostupný v Claude Code, můžete vést nekonečně dlouhý rozhovor, kde rozumí všemu uvnitř bez jakéhokoliv zhoršení. Co se týče návrhu, výzkumu, přicházení s novými nápady. Je to lepší, ale není to úplně úroveň experta na úrovni člověka. Může navrhovat řešení, která bych považoval za dobrý design, ale zatím úplně neumí 'myslet s portály'. Přesto to bylo dobré zlepšení oproti tomu, co jsme měli předtím, kdy prakticky neexistovalo. Vše výše jsem zjistil testováním v posledních dnech, kdy úkolem je napsat interpreter pro jazyk, který jsme navrhovali za běhu. Je to velmi specializovaný design, podobný Self a Smalltalk, jen jazyk stavíme přímo v něm. To vede k extrémně obtížným situacím, kdy se snažíte definovat, jak funkce fungují – uvnitř jazyka – a přitom ještě funkce nemáte! A přesto odvádí skvělou práci. Někdy ani úplně nechápu, co po něm chci, ale Opus ano a dělá to dobře. TL; DR: Je to Sonet 3.5 roku 2025. Zkus to. Udělej to teď