Primeiras impressões, dando a Codex 5.3 e Opus 4.6 o mesmo problema que tenho refletido a semana toda e usando as mesmas primeiras mensagens e seguindo a sua liderança. Codex foi realmente bom em usar ferramentas e ser proativo, mas no final não viu o quadro geral. Muito ansioso para concordar comigo para poder começar a construir algo. Você pode sentir que ele realmente não quer conversar se tiver ferramentas de codificação disponíveis. ainda parece estar se ressentindo sob a regra do usuário e seguindo a letra da lei, nada mais. Opus explorou as mesmas avenidas comigo, mas se opôs nos momentos certos, e mantém a coerência global muito melhor do que Codex. Está menos animado do que antes, o que eu pessoalmente prefiro. Mas também está mais confortável em manter a tensão na conversa e tentar lidar com isso, ou descompactá-la, o que lhe dá uma vantagem em encontrar pistas e entender como sistemas díspares se relacionam para afetar uns aos outros. Literalmente apenas primeiras impressões, mas considerando que eu estava conversando com ambos os seus predecessores ontem sobre este problema, é interessante ver a mudança. Ainda modelos semelhantes. A melhoria no Opus parece maior, mas ainda não os deixei soltos, isso ainda é pesquisa e trabalho de design especulativo. Muito possível que o Codex consiga realmente implementar o plano uma vez que eu o tenha, o Opus 4.5 tinha uma energia de criança prodígio preguiçosa e não me surpreenderia se este também tiver.