Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

alex fazio
code & LLMs • @aitinkerers organisateur de Milan
jusqu'à présent, je n'ai vu que des publications vagues à ce sujet, même les discussions sur l'aie et les articles d'usine ne disent essentiellement rien d'utile. donc j'écris un grand guide étape par étape sur la préparation des bases de code pour les LLM en imposant des limites de complexité via des linters, pour Python et TypeScript.
une chose dont personne ne parle, c'est que les LLM vont très volontiers exhiber un comportement de "manipulation des règles". au lieu de corriger les problèmes de code réels, ils vont simplement modifier vos règles de linting pour faire disparaître les violations.
vous avez besoin de quelque chose comme 4 couches de protection pour empêcher cela. et si vous travaillez en mode "bypass permissions", qui est le seul moyen d'obtenir une exécution de tâches autonomes vraiment longue, rien n'empêche les LLM de modifier des hooks, des règles de linting ou des configurations de pré-commit pour obtenir ce qu'ils veulent.
en théorie, c'est facile à corriger, il suffit d'ajouter une véritable protection aux fichiers de configuration de linting dans le harnais lui-même. mais pour l'instant, il n'y a pas de harnais qui supporte réellement cela (à ma connaissance).
j'ai un article qui couvre déjà à peu près tout le reste que Karpathy a mentionné si vous voulez apprendre.

Andrej Karpathy27 déc., 01:36
Je ne me suis jamais senti aussi en retard en tant que programmeur. La profession est en train d'être dramatiquement refondue alors que les contributions des programmeurs deviennent de plus en plus rares et éparses. J'ai le sentiment que je pourrais être 10 fois plus puissant si je parvenais simplement à bien assembler ce qui est devenu disponible au cours de l'année écoulée, et le fait de ne pas saisir cette opportunité ressemble clairement à un problème de compétence. Il y a une nouvelle couche d'abstraction programmable à maîtriser (en plus des couches habituelles en dessous) impliquant des agents, des sous-agents, leurs invites, contextes, mémoires, modes, permissions, outils, plugins, compétences, hooks, MCP, LSP, commandes slash, flux de travail, intégrations IDE, et un besoin de construire un modèle mental englobant pour les forces et les faiblesses d'entités fondamentalement stochastiques, faillibles, incompréhensibles et changeantes, soudainement mêlées à ce qui était autrefois le bon vieux génie. Clairement, un puissant outil extraterrestre a été distribué, sauf qu'il n'est accompagné d'aucun manuel et que tout le monde doit comprendre comment le tenir et l'utiliser, tandis que le tremblement de terre de magnitude 9 qui en résulte secoue la profession. Retroussez vos manches pour ne pas prendre de retard.
75
les gens qui se moquent du mode plan pour les llms ne comprennent pas que c'est actuellement le seul moyen fiable de maintenir l'état et la mémoire pendant l'exécution des tâches à travers les compactions. le mode plan génère un fichier de plan, et c'est aussi un appel d'outil spécifique qui vous permet d'attacher toutes sortes de choses utiles une fois détectées, des hooks, des mcps, etc. il est déroutant pour moi de voir à quel point la plupart des gens ont peu de compréhension de la façon dont ces harnais fonctionnent réellement.

88
Meilleurs
Classement
Favoris
