Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

alex fazio
Code & LLMs • @aitinkerers Mailand Organizer
Bisher habe ich nur vage Beiträge dazu gesehen, selbst die AIE-Gespräche und Fabrikartikel sagen im Grunde nichts Nützliches. Deshalb schreibe ich einen umfassenden Schritt-für-Schritt-Leitfaden, um Codebasen LLM-fähig zu machen, indem ich Komplexitätsgrenzen durch Linter durchsetze, sowohl für Python als auch für TypeScript.
Eine Sache, über die niemand spricht, ist, dass LLMs sehr gerne "Regelspielverhalten" zeigen. Anstatt tatsächliche Codeprobleme zu beheben, werden sie einfach deine Linter-Regeln ändern, um die Verstöße verschwinden zu lassen.
Du brauchst etwas wie 4 Schutzschichten, um dies zu verhindern. Und wenn du im "Berechtigungen umgehen"-Modus arbeitest, was der einzige Weg ist, um wirklich lange autonome Aufgaben auszuführen, gibt es nichts, was LLMs daran hindert, Hooks, Linter-Regeln oder Pre-Commit-Konfigurationen zu ändern, um ihren Willen durchzusetzen.
Theoretisch ist das leicht zu beheben, füge einfach echten Schutz zu den Linter-Dotfiles im Harness selbst hinzu. Aber im Moment gibt es kein Harness, das dies tatsächlich unterstützt (soweit ich weiß).
Ich habe einen Artikel, der bereits fast alles abdeckt, was Karpathy erwähnt hat, wenn du lernen möchtest.

Andrej Karpathy27. Dez., 01:36
Ich habe mich als Programmierer noch nie so hinterher gefühlt. Der Beruf wird dramatisch umgestaltet, da die von den Programmierern beigetragenen Bits zunehmend spärlich und dazwischen sind. Ich habe das Gefühl, dass ich 10X leistungsfähiger sein könnte, wenn ich nur richtig zusammenfüge, was im letzten Jahr verfügbar geworden ist, und ein Versäumnis, den Boost zu nutzen, fühlt sich entschieden wie ein Skill-Problem an. Es gibt eine neue programmierbare Abstraktionsschicht zu meistern (neben den üblichen Schichten darunter), die Agenten, Unteragenten, deren Eingabeaufforderungen, Kontexte, Gedächtnis, Modi, Berechtigungen, Werkzeuge, Plugins, Fähigkeiten, Hooks, MCP, LSP, Slash-Befehle, Workflows, IDE-Integrationen und die Notwendigkeit umfasst, ein allumfassendes mentales Modell für Stärken und Schwächen von grundsätzlich stochastischen, fehleranfälligen, unintelligiblen und sich verändernden Entitäten zu entwickeln, die plötzlich mit dem, was früher gute alte Ingenieurskunst war, vermischt sind. Offensichtlich wurde ein mächtiges, fremdes Werkzeug herumgereicht, aber es kommt ohne Handbuch, und jeder muss herausfinden, wie man es hält und bedient, während das resultierende Erdbeben der Stärke 9 den Beruf erschüttert. Rollt die Ärmel hoch, um nicht hinterherzufallen.
71
Die Leute, die den Planmodus für LLMs verspotten, verstehen nicht, dass es derzeit der einzige zuverlässige Weg ist, den Zustand und das Gedächtnis während der Aufgabenausführung über Kompaktierungen hinweg aufrechtzuerhalten. Der Planmodus generiert eine Plan-Datei, und es ist auch ein spezifischer Toolaufruf, der es dir ermöglicht, allerlei nützliche Dinge anzuhängen, sobald sie erkannt werden, Hooks, MCPs usw. Es ist für mich verblüffend, wie wenig Verständnis die meisten Menschen dafür haben, wie diese Harnesses tatsächlich funktionieren.

84
Top
Ranking
Favoriten
