Opus 4.5: 7.5-8/10 hilfreich. Ich vertraue diesem Modell endlich, um für mich zu schreiben, und es hat tatsächlich ein gutes Urteilsvermögen/Geschmack dafür, was wichtig ist. Beim Programmieren fühlt es sich an, als könnte es einfach ewig arbeiten und nicht in den gleichen Coding-Doom-Loops stecken bleiben wie frühere Modelle. Einige Dinge sind immer noch nicht perfekt: Gedächtnis, Computerbenutzung, Dokumentenerstellung, Proaktivität usw., aber es gibt eine klare Sicht auf Verbesserungen in diesen Bereichen (einige Produkt-UX-Innovationen sind hier ebenfalls erforderlich). An diesem Punkt fühlt es sich an, als wären wir nur noch ein paar Modellgenerationen davon entfernt, für mich nahe an einer 10/10 zu sein.