Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Claude Opus 4.5: reseña completa
Este es el mejor lanzamiento de modelo en mucho, mucho tiempo en cuanto a programación. Me alucina lo buena que es. No había visto una mejora tan grande desde el lanzamiento original de gpt-4-0314
La principal mejora es que por fin han pensado cómo 'pensar' correctamente.
Ya no comete errores lógicos horribles en su pensamiento.
Problemas como "Vale, haré pruebas ahora. <¡Los exámenes fallan> ¡Genial! Los exámenes superados." ya no existen.
Esto se generaliza a prácticamente TODA la lógica cuando se trata de pensar en código: rara vez, si acaso, comete errores.
El siguiente gran hito: ¡ya no escribe código slop! Esto es enorme. Con Codex, puedes conseguir que escriba código que funcione. Pero escribe código horrible: funciones inútiles, malas abstracciones, etc. Esto es un fastidio, porque funciona a corto plazo, pero a largo plazo el modelo se verá atrapado en un callejón donde ya no podrá trabajar con el código que escribió él mismo.
No es el caso de Opus. No solo escribe código elegante, sino que también sabe cómo refactorizar código slop en código no slop. Entiende profundamente la base de código y puede idear soluciones elegantes que no son solo refactorizaciones 'mecánicas'.
Es muy autónomo e independiente. Por sí solo, cuando se encuentra con problemas, crea ejemplos reproducibles, intenta seccionar por la mitad de dónde proviene el error y luego lo corrige sin quedarse atascado en madrigueras de conejo. ¡Aunque el error esté en alguna parte no relacionada del código — código que ni siquiera escribió él mismo!
¡Además, HACE EXACTAMENTE LO QUE DICES, SIN ESCATIMAR NADA! Esto es enorme!! Usar Codex es básicamente un juego de golpear al topo donde entiende lo que quieres que haga, pero es demasiado difícil y se abre paso por recompensas y se convierte en una solución cutre que no quieres.
Opus realmente aborda el problema y lo resuelve bien, aunque sea difícil.
La comprensión de contexto largo es prácticamente perfecta. Combinado con el mecanismo de compactación disponible por defecto en Claude Code, básicamente puedes tener una conversación infinitamente larga en la que entiende todo lo que contiene, sin degradación.
En cuanto a diseño, investigación, idear ideas novedosas. Es mejor, pero no del todo al nivel de un experto humano. Puede proponer soluciones que consideraría buen diseño, pero aún no puede 'pensar con portales'. Aun así, una buena mejora respecto a lo que teníamos antes, que era prácticamente inexistente.
Todo lo anterior lo he recopilado probándolo en los últimos días, donde la tarea consiste en escribir un intérprete para un lenguaje que estábamos diseñando sobre la marcha. Es un diseño muy de nicho, similar a Self y Smalltalk, excepto que estamos construyendo el lenguaje dentro del propio idioma. Esto lleva a escenarios extremadamente difíciles en los que intentas definir cómo funcionan las funciones —dentro del lenguaje— ¡cuando aún no tienes funciones! Y sigue haciendo un trabajo magnífico. A veces, ni siquiera entiendo del todo lo que le pido, pero Opus sí, y hace un buen trabajo.
TL; DR: Es el Soneto 3.5 de 2025. Pruébalo. Hazlo ya
Populares
Ranking
Favoritas

