DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Brian Zhan

Investitionen in KI in der Frühphase @CRV. Seed/A: @Reflection_AI, @SkildAI, @DynaRobotics, @LanceDB, Lepton (acq NVIDIA), @VoyageAI (acq MongoDB), @SDFLabs (acq dbt)

Wenn du bereits im Claude Code lebst, kennst du die offensichtlichen Dinge (terminal-nativ, enger Loop, beobachte es laufen, Protokolle durchsuchen, patchen, erneut ausführen, committen). Also hier ist die interessantere Frage: Warum fühlt sich Codex so an, als würde es aufholen, ohne einfach die interaktive Terminal-Agenten-Atmosphäre zu klonen? Codex ist delegationsorientiert, nicht pair-programming-orientiert. Die Superkraft von Claude Code ist der enge interaktive Kontrollloop: du und der Agent teilen sich ein Cockpit. Es ist beobachtbar. Du greifst mitten im Flug ein. Du steuerst, bevor es Zeit auf einem schlechten Weg verbrennt. Es ist im Grunde der Agent als Erweiterung deiner Shell. Codex’ Wette ist anders: Agent als paralleler Kollege, der auf seinem eigenen Computer arbeitet. Diese Rahmenbedingungen implizieren eine Reihe von Produktfolgen, die leicht übersehen werden können, wenn man nur die Ausgaben der Modelle vergleicht: 1) Asynchronität als Feature (nicht als Nebenwirkung) Codex ist so konzipiert, dass du eine Aufgabe übergibst, etwas anderes machst und zu einem überprüfbaren Artefakt zurückkommst. Der Schwerpunkt liegt auf PRs/Diffs. Deshalb siehst du Begriffe wie „delegieren“, „Abundanz-Mindset“, „eine Reihe von Aufgaben anstellen“. Der Workflow ist: N Jobs starten, dann überprüfen/zusammenführen. 2) Isolation und Sandboxing sind nicht nur Infrastruktur, sondern UX. Jede Aufgabe, die in ihrer eigenen isolierten Umgebung läuft, verändert das Vertrauensmodell: Der Agent kann Tests ausführen, Dateien ändern, Commits generieren, ohne deinen lokalen Arbeitsbereich zu kontaminieren. Du erhältst Sicherheitsgrenzen (und oft konservative Standards), die es einfacher machen, es einfach zuzulassen. 3) Mergeability ist die tatsächliche Zielmetrik. Claude Code fühlt sich großartig an, weil der Loop konvergiert. Während Codex explizit darauf optimiert, etwas zurückzubringen, das du zusammenführen kannst. Die Form des Vergleichs wird klarer: Claude Code = am besten, wenn die Aufgabe mid-stream Urteilsentscheidungen, schnelle Unterbrechungen und menschliches Steuern benötigt. Es ist der „enge Cockpit-Loop“. Codex = am besten, wenn die Aufgabe delegiert, parallelisiert und als zusammenführbare Artefakte zurückgegeben werden kann. Es ist „Kollege mit eigenem Arbeitsbereich“. Die tiefere Grenze ist nicht die Qualität der Autovervollständigung. Es sind End-to-End-Kontrollloops mit Verifizierung: Kontext -> Plan -> Änderungen -> Ausführung -> Verifizierung -> überprüfbares Artefakt Und der echte Graben wird bei Verifizierung und Geschmack gebaut: - Führt es die richtigen Tests aus? - Interpretiert es CI-Fehler korrekt? - Produziert es kleine Diffs, die den Idiomen deines Repos entsprechen? - Gibt es zuverlässig etwas zurück, das du ohne Aufsicht zusammenführen kannst? Mein Verdacht ist, dass wir zu einem hybriden Workflow konvergieren: interaktiver Claude Code Loop für mehrdeutige Arbeiten + sandboxed parallele Codex-Jobs für Durchsatz. Der Gewinner ist, wer den besten Router über diese Modi baut und die Delegation so zuverlässig macht wie git status.

Top

Ranking

Favoriten