Ok, myślę, że mój eksperyment z pozostawieniem AI do pracy 24/7 kończy się tutaj. To nie działa. Kod eksploduje w złożoności, wyniki nie są zbyt dobre, AI nie potrafi przejść przez trudne ściany (wciąż jest całkowicie niezdolne do nawet *pojęcia* SupGen), a koszty są szalone (wydałem ~1k w ciągu ostatnich 2 dni). Najlepsze wyniki są w kompilatorze JS, głównie dlatego, że jest znajomy (w porównaniu do inets), ale nie warto tracić kontroli nad bazą kodu. Myślę, że marzenie o tym, aby AI pracowały w tle i robiły realne postępy w rzeczach, które mają znaczenie (tj. naprawdę nowych rzeczach), jeszcze nie nadeszło. To wciąż maszyna utknęła na własnych danych treningowych, niezdolna do myślenia poza schematami. Jest świetna w budowaniu rzeczy, które już zostały zbudowane. Ale nie w nowych rzeczach. Ponadto programowanie w normalny sposób ma niedocenianą zaletę, że robisz dwie rzeczy jednocześnie: budujesz bazę kodu *i* ją poznajesz. AI robi tylko połowę z tego. Druga połowa jest oczywiście niemożliwa 🤔
a może po prostu nie mogę znieść odpowiadania na głupie pytania poważnie, GPT-5.3 *nie potrafi komunikować się*. pisze mnóstwo rzeczy, a potem zadaje TOBIE pytania o swój własny kod. jakbyś to ty go napisał. zakładając, że wiesz, o czym mówi nie ma mentalnego modelu tego, co się dzieje
a może po prostu nie mogę znieść odpowiadania na głupie pytania poważnie, GPT-5.3 *nie potrafi komunikować się*. pisze mnóstwo rzeczy, a potem zadaje TOBIE pytania o swój własny kod. jakbyś to ty go napisał. zakładając, że wiesz, o czym mówi nie ma w ogóle teorii umysłu.
Tęsknię za sonetem 3.5, kiedy AI było tylko wspaniałym autouzupełnianiem. Może powinienem dać opus 4.6 większą szansę. Oczywiście popełnia więcej logicznych błędów niż gpt 5.3, ale wszystko inne w nim jest znacznie bardziej przyjemne. A jeśli i tak wyjaśniam całą logikę... czemu nie?
Tęsknię za sonetem 3.5, kiedy AI było tylko wspaniałym autouzupełnianiem. Może powinienem dać opus 4.6 większą szansę. Oczywiście popełnia więcej logicznych błędów niż gpt 5.3, ale wszystko inne w nim jest o wiele bardziej przyjemne. A jeśli i tak wyjaśniam całą logikę... czemu nie?
Dziś rano: "Bend→JS bot jest całkowicie zablokowany. Agent wyczerpał łatwe zwycięstwa i teraz próbuje coraz bardziej desperackich mikro-optymalizacji, które wszystkie kończą się niepowodzeniem. Wskaźniki wydajności nie zmieniły się od momentu, gdy początkowe zwycięstwa miały miejsce ~50 rund temu." Inne boty mają podobny los ):
Dziś rano: "Bend→JS bot jest całkowicie zablokowany. Agent wyczerpał łatwe zwycięstwa i teraz próbuje coraz bardziej desperackich mikro-optymalizacji, które wszystkie zawodzą, zadając pytania o wewnętrzne działanie V8. Wyniki testów nie zmieniły się w ogóle od około 50 rund temu." westchnienia
76