Ok, ik denk dat mijn experiment om AI 24/7 aan het werk te zetten hier eindigt. Het werkt niet. De code explodeert in complexiteit, de resultaten zijn niet zo geweldig, de AI kan niet voorbij harde muren komen (het is nog steeds volledig niet in staat om zelfs maar *te begrijpen* SupGen), en het is belachelijk duur (ongeveer 1k uitgegeven in de afgelopen 2 dagen). De beste resultaten zijn op de JS-compiler, vooral omdat het vertrouwd is (vergeleken met inets), maar het is het niet waard om de controle over de codebase te verliezen. Ik denk dat de droom om AI's op de achtergrond te laten werken en echte vooruitgang te boeken op dingen die ertoe doen (d.w.z. echt nieuwe dingen) nog niet hier is. Het is nog steeds een machine die vastzit aan zijn eigen trainingsdata, niet in staat om buiten de gebaande paden te denken. Het is geweldig voor het bouwen van dingen die al gebouwd zijn. Maar niet voor nieuwe dingen. Ook heeft normaal coderen het ondergewaardeerde voordeel dat je twee dingen tegelijk doet: een codebase *bouwen* en deze leren. AI's doen slechts de helft daarvan. De andere helft is duidelijk onmogelijk 🤔
of misschien kan ik gewoon niet tegen het beantwoorden van domme vragen serieus, GPT-5.3 *kan niet communiceren*. het schrijft veel dingen, en vraagt dan JOU vragen over zijn eigen code. alsof jij het hebt geschreven. ervan uitgaande dat je weet waar het over praat het heeft geen mentaal model van wat er aan de hand is
of misschien kan ik gewoon niet tegen het beantwoorden van domme vragen serieus, GPT-5.3 *kan niet communiceren*. het schrijft veel dingen, en vraagt dan JOU vragen over zijn eigen code. alsof jij het hebt geschreven. ervan uitgaande dat je weet waar het over praat het heeft helemaal geen theorie van de geest.
Ik mis sonnet 3.5 keer toen AI gewoon een glorified autocomplete was. Misschien moet ik opus 4.6 een grotere kans geven. Natuurlijk maakt het meer logische fouten dan gpt 5.3, maar alles aan het is zoveel aangenamer. En als ik toch alle logica uitschrijf... waarom niet?
Ik mis sonnet 3,5 keer toen AI gewoon een glorified autocomplete was. Misschien moet ik opus 4,6 een grotere kans geven. Natuurlijk maakt het meer logische fouten dan gpt 5,3, maar alles aan het is zoveel aangenamer. En als ik toch alle logica uitschrijf... waarom niet?
Vanmorgen: "Bend→JS bot is volledig vastgelopen. De agent heeft de gemakkelijke overwinningen uitgeput en probeert nu steeds wanhopigere micro-optimalisaties die allemaal falen. De benchmarks zijn niet veranderd sinds de eerste overwinningen ongeveer 50 rondes geleden binnenkwamen." Andere bots ondergaan een vergelijkbaar lot ):
Vanmorgen: "Bend→JS-bot is volledig vastgelopen. De agent heeft de gemakkelijke overwinningen uitgeput en probeert nu steeds wanhopigere micro-optimalisaties die allemaal falen, terwijl hij vragen stelt over V8-internals. De benchmarks zijn sinds ~50 rondes geleden helemaal niet veranderd." zucht
85