Niemand weet wat er gaat komen Een enkele persoon met een idee zou binnen 2 jaar als de "CEO" van een bedrijf met 10.000 agenten kunnen optreden. Je zult "software als een gedachte" hebben, niet als een dienst. Wanneer je spreekt, bouwt een miljard instanties een "swarm" de backend, frontend, beveiliging en schaalinfrastructuur in enkele minuten. De afgelopen 18 maanden hebben de snelste voortgang gezien die we ooit in de geschiedenis van de computerwetenschap hebben meegemaakt. Ik dring er bij je op aan om te lezen over SWE pro. Het is gemaakt om contaminatieresistent te zijn. Ik heb nog geen goede reden gelezen waarom, zodra we 90-100% scoren op deze benchmark, niet alle software-engineering opgelost zou zijn. Dit is een van de meest complexe en moeilijk ontworpen benchmarks. De taken zijn zo lang dat de agent in staat moet zijn om te leren van zijn eigen mislukte testruns binnen dezelfde sessie - in wezen zou een model enige vorm van continu leren moeten hebben om deze benchmark te overtreffen. Gemini 2.5 preview scoorde 13% Gemini 3 preview scoorde 43% Claude Opus 4.5 is momenteel in de lead met 45% (volgens scale ai) — JE HEBT MENSEN BIJ ANTHROPIC DIE JE ZEGGEN DAT ZE CLAUDE DE HELE DAG KIJKEN EN GATEN INVULLEN. Natuurlijk kun je wolf roepen dat ze gemotiveerd zijn om het te zeggen, maar is je X-tijdlijn de afgelopen 2 weken niet constant geschokt over hoe goed de modellen zijn in coderen? Vooral 4.5 Opus? Het is voor mij overduidelijk dat software-engineering binnen 2 jaar opgelost zal zijn. Zelfs als je die schatting zou verdubbelen, nee, verdrievoudigen, zou het een DIEPE impact hebben op het BBP en het gemiddelde leven van de Amerikaan.