alltså om gränserna för AI för autonom utveckling För kontext: för några dagar sedan skrev jag en prompt för en "NanoHVM" – en leksaksversion av min runtime, med 16-bitars termer – och bad AI:erna att skriva en utvärderare. efter några loopar av samarbete mellan människa och AI fick jag en förvånansvärt snabb implementation tyvärr blev filen väldigt stor och ful, så jag ville göra den mindre. Jag ordnade en codex/claude/gemini-session och bad dem att "göra den kortare". första prompten fungerade, så jag upprepade samma förfrågan, om och om igen, i flera timmar. till slut stötte AI:n på en vägg. oavsett hur mycket jag fortsatte fråga kunde de inte förkorta det över en viss gräns. Jag ville förstå varför, så jag läste filen. Till min förvåning var det uppenbarligen inte optimalt – massor av redundanser och dåliga abstraktioner – men det förändrades knappt längre. Commit efter commit, det innehöll fortfarande samma tekniker, samma tillvägagångssätt och samma redundanser. Det fanns bara små justeringar, men ingen större omskrivning gjordes, och det behövdes för ytterligare framsteg. Så jag bad AI:n att göra just det. "Gör en total omskrivning den här gången" "resonera om det grundläggande" "Du är fri att ändra vad som helst" "sluta göra inkrementella förändringar" "ersätta X med en helt ny metod" Men detta var lönelött. Dessa generiska förfrågningar hade ingen effekt alls. Flera timmar senare implementerade filen fortfarande samma tillvägagångssätt. AI:n satt fast i ett lokalt minima och kunde inte ta sig ur det. så jag gav upp och bestämde mig för att gå med. Jag tog några minuter att fundera på det och skrev en kort prompt – ungefär 500 tokens lång – med specifika instruktioner. "ersätt X med Y, gör Z på detta sätt". På något sätt fick dessa ~3 stycken något att klicka, de löste sig direkt, arbetade i ~1 timme och 30 minuter i sträck, och kom tillbaka med en fil som var nästan dubbelt så mycket mindre *och* 10 % snabbare. Och det var en riktigt vacker, högkvalitativ fil Så, jag antar att lärdomen är: moderna AI:er kan inte göra autonoma framsteg. Om du låter dem arbeta utan tillsyn kommer de att fastna. Det är en grundläggande begränsning för hur dessa saker fungerar, åtminstone för tillfället. Men om du varannan timme tar 5–10 minuter på dig att återbesöka dem, förstå var de är och injicera lite mänsklig kunskap – då kommer de bara att fortsätta, göra enorma mängder arbete och få otroliga resultat, medan du tillbringar helgen med att spela några spel Jag undrar vad som saknas för att de ska kunna ta sig loss utan min inblandning. Det känns som att min prompt inte hade något speciellt. alla idéer om den är koncept som dessa AI:er känner till, och det känns som att de absolut kunde ha kommit på dessa idéer själva. Ändå gör de bara inte... Varför? Hur som helst, jag planerar att öppna den här söta saken senare nästa vecka. Det är inte direkt användbart för de flesta av er, men om du av en slump har letat efter världens snabbaste 16-bitars mönstermatchningsmotor, kan denna fil vara precis vad du letat efter!
"Varning, detta är din sista redigering" Ingen fara, jag är säker på att det var det sista stavfelet
Åh, fan
49