Manchmal macht mein Agent Fehler. Er zerstört eine Funktion beim Zusammenführen eines PRs. Er sagt mir, dass alles erledigt ist und die Tests bestanden wurden, aber die grundlegende Funktionalität fehlt. Das ist normalerweise eine gute Gelegenheit, um zusätzliche Werkzeuge oder Sicherheitsvorkehrungen in deinen Arbeitsablauf einzufügen. 🧵
Aber wenn das schwierig oder kompliziert ist, oder wenn du dir nicht sicher bist, was du hinzufügen sollst, dann machst du es einfach nicht. Und schließlich findest du dich dabei wieder, die gleichen Probleme immer wieder zu lösen.
Amazon (und viele andere Unternehmen) haben einen formalen Post-Mortem-Prozess für jedes Mal, wenn es einen Produktionsausfall oder ein Problem gibt, das die Kunden betrifft. Es wird als CoE bezeichnet und an anderen Orten. Es wird normalerweise einfach als Post-Mortem bezeichnet.
Die Idee ist einfach. Sie machen eine fehlerfreie Rückschau darauf, was passiert ist, damit die Sache schiefgeht, wie Sie es bemerkt haben und wie Sie es beheben, und dann führen Sie eine Ursachenanalyse durch, um herauszufinden, was die tatsächlichen strukturellen Probleme sind.
Mir ist heute im Auto aufgefallen, dass ich Fehler, die mein Agent macht, auf die gleiche Weise behandeln kann. Ich kann die Ursachen herausfinden, warum ein Feature die Qualitätssicherung bestanden hat, obwohl es nur halb funktionierte. Ich kann herausfinden, was die fehlende Sicherheitsvorkehrung ist, die uns während der Zusammenführungen ständig dazu gebracht hat, Features zu überarbeiten.
Hier ist die Fähigkeit: das nächste Mal, wenn Ihr Agent einen Fehler macht und Ihr Projekt durcheinanderbringt, sagen Sie einfach /coe oder das /post-mortem-Formular ist nach dem Zusammenführen von 3 PRs kaputt gegangen
Ich habe das heute Abend schon ein paar Mal verwendet und füge weitere Leitplanken zu den Fähigkeiten und Werkzeugen hinzu, die es meinem Agenten ermöglichen, schnell zu agieren. Probier es aus!
275