Ingen vet hva som kommer En enkelt person med en idé kan fungere som «administrerende direktør» for et selskap med 10 000 agenter om 2 år Du vil ha «programvare som en tanke» og ikke som en tjeneste. Når du snakker, bygger en milliard instanser "swarm" backend, frontend, sikkerhet og skaleringsinfrastruktur på minutter. De siste 18 månedene har vært det raskeste tempoet vi noen gang har sett i informatikkens historie. Jeg oppfordrer deg til å lese om SWE Pro. Den var laget for å være motstandsdyktig mot forurensning. Jeg har ennå ikke lest en god grunn til at når vi først scorer 90-100 % på denne benchmarken, vil ikke all programvareutvikling være løst. Dette er en av de mest komplekse og vanskelig utformede benchmarkene. Oppgavene er så lange at agenten må kunne lære av sine egne mislykkede testkjøringer i samme økt – i praksis må en modell ha en form for kontinuerlig læring for å slå denne standarden. Gemini 2.5 forhåndsvisning fikk 13 % Gemini 3 forhåndsvisning fikk 43 % Claude Opus 4.5 leder for øyeblikket med 45 % (ifølge scale ai) — DU HAR FOLK HOS ANTHROPIC SOM FORTELLER DEG AT DE SER PÅ CLAUDE HELE DAGEN OG FYLLER INN HULLENE. Selvfølgelig kan du rope ulv for at de har insentiv til å si det, men har ikke din X-tidslinje de siste to ukene vært et konstant sjokk over hvor gode modellene til koding er? Spesielt 4.5 Opus? Det er helt klart for meg at programvareutvikling vil være løst på 2 år. Selv om du skulle doble, nei, TRIPPEL, ville det gjettet ha en DYP innvirkning på BNP og gjennomsnittlig amerikansk liv