Wciąż jestem rozczarowany stanem lokalnych agentów kodowania. Zapłaciłem sporą sumę za wystarczający sprzęt do uruchomienia qwen3.5:122b @ q4, qwen3.5:35b @ q8 i qwen3-coder:30b @ q8. Żaden z nich nie potrafi skutecznie wykonać tego, co powinno być całkowicie mechaniczną refaktoryzacją TypeScript. Zgłoszenie poniżej.
Dostarczyłem przykładowe różnice z już zrefaktoryzowanych plików, jasno określiłem, co należy zrobić ("dodaj argument tego typu do funkcji, które zwracają ten typ"), dostarczyłem skrypt do samosprawdzania, który drukuje błędy i filtruje szum z jeszcze niezrefaktoryzowanych plików, aby uniknąć rozpraszaczy.
Co się dzieje w praktyce: Produkują częściowy kod, który generuje nowe błędy (nieużywane importy), dodają nowy kod, który nie przechodzi kontroli składni, rozpraszają się własnymi wprowadzonymi błędami, wywołują funkcje (zdefiniowane w tym samym pliku) z argumentami, które nie istnieją, utkną i wchodzą w pętlę.
Spędziłem teraz więcej czasu próbując to uruchomić, niż zajęłoby mi zrobienie tego samodzielnie, wielokrotnie. Czy ktoś miał podobne doświadczenie? Jak sprawić, aby to działało bardziej niezawodnie?
Nadal nie chcę przekazywać Anthropic ani insert-tech-giant-here moich danych osobowych. A nawet z czymś takim jak @AskVenice czy OpenRouter, Cline ujawnia wiele informacji systemowych w samym promptcie.
68