Toujours déçu par l'état des agents de codage locaux. J'ai payé une jolie somme pour un matériel suffisant pour faire fonctionner qwen3.5:122b @ q4, qwen3.5:35b @ q8, et qwen3-coder:30b @ q8. Aucun d'eux ne peut réussir à faire ce qui devrait être un refactorisation TypeScript complètement mécanique. Rant ci-dessous.
J'ai fourni des différences d'exemple provenant de fichiers déjà refactorisés, je suis explicite sur ce qu'il faut faire ("ajouter un argument de ce type aux fonctions qui retournent ce type"), j'ai fourni un script d'auto-vérification imprimant les erreurs et filtrant le bruit des fichiers encore non refactorisés pour éviter les distractions.
Que se passe-t-il en pratique : Ils produisent un code partiel qui génère de nouvelles erreurs (importations inutilisées), ajoutent un nouveau code qui échoue aux vérifications de syntaxe, se laissent distraire par leurs propres erreurs auto-introduites, appellent des fonctions (définies dans le même fichier) avec des arguments qui n'existent pas, se bloquent et bouclent.
J'ai maintenant passé plus de temps à essayer de faire fonctionner cela que cela ne m'aurait pris de le faire moi-même, plusieurs fois. Quelqu'un a-t-il eu une expérience similaire ? Comment faire pour que cela fonctionne de manière plus fiable ?
Je ne veux toujours pas donner mes informations personnelles à Anthropic ou à insérer-un-grand-groupe-tech-ici. Et même avec quelque chose comme @AskVenice ou OpenRouter en jeu, Cline divulgue beaucoup d'informations système dans le prompt lui-même.
57