Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

Brian Zhan

Inwestowanie w @CRV na wczesnym etapie AI. Seed/A: @Reflection_AI, @SkildAI, @DynaRobotics, @LanceDB, Lepton (acq NVIDIA), @VoyageAI (acq MongoDB), @SDFLabs (acq dbt)

Jeśli już żyjesz w Claude Code, znasz oczywiste rzeczy (terminal-native, tight loop, watch it run, grep logs, patch, rerun, commit). Więc oto bardziej interesujące pytanie: dlaczego Codex wydaje się doganiać, nie klonując po prostu interaktywnej atmosfery terminala? Codex jest pierwszeństwem delegacji, a nie pierwszeństwem programowania w parach. Supermoc Claude Code to ścisła interaktywna pętla kontrolna: tu i agent dzielicie jedną kokpit. To jest do obserwacji. Interweniujesz w trakcie lotu. Kierujesz, zanim straci czas na złą ścieżkę. To w zasadzie agent jako rozszerzenie twojego powłoki. Zakład Codexu jest inny: agent jako równoległy współpracownik, który pracuje na swoim własnym komputerze. To ujęcie implikuje szereg konsekwencji produktowych, które łatwo przeoczyć, jeśli porównujesz tylko wyniki modeli: 1) Asynchronia jako cecha (a nie efekt uboczny) Codex jest zaprojektowany tak, abyś mógł przekazać zadanie, zająć się czymś innym i wrócić do przeglądu artefaktu. Centrum grawitacji staje się PR-y/diff. Dlatego widzisz język taki jak „delegować”, „mentalność obfitości”, „kolejkować wiele zadań”. Przepływ pracy to: uruchom N zadań, a następnie przegląd/połączenie. 2) Izolacja i sandboxing to nie tylko infrastruktura, to UX. Każde zadanie działające w swoim własnym izolowanym środowisku zmienia model zaufania: Agent może uruchamiać testy, modyfikować pliki, generować commity bez zanieczyszczania twojego lokalnego obszaru roboczego. Otrzymujesz granice bezpieczeństwa (i często konserwatywne domyślne ustawienia), które ułatwiają mu po prostu to zrobić. 3) Mergeability to rzeczywisty docelowy wskaźnik. Claude Code działa świetnie, ponieważ pętla się zbiega. Podczas gdy Codex wyraźnie optymalizuje, aby wrócił z czymś, co możesz połączyć. Kształt porównania staje się jaśniejszy: Claude Code = najlepszy, gdy zadanie wymaga ocen w trakcie, szybkich przerwań i ludzkiego kierowania. To „ścisła pętla kokpitu”. Codex = najlepszy, gdy zadanie można delegować, równolegle przetwarzać i zwracać jako artefakty do połączenia. To „współpracownik z własnym obszarem roboczym”. Głębsza granica to nie jakość autouzupełniania. To pętle kontrolne end-to-end z weryfikacją: kontext -> plan -> edycje -> wykonanie -> weryfikacja -> artefakt do przeglądu A prawdziwy fosa buduje się przy weryfikacji i smaku: - czy uruchamia odpowiednie testy? - czy poprawnie interpretuje błędy CI? - czy produkuje małe różnice, które pasują do idiomów twojego repozytorium? - czy niezawodnie zwraca coś, co możesz połączyć bez opieki? Moim zdaniem zbiegnie się do hybrydowego przepływu pracy: interaktywna pętla Claude Code dla niejednoznacznej pracy + sandboxowane równoległe zadania Codex dla wydajności. Zwycięzcą jest ten, kto zbuduje najlepszy router w tych trybach i sprawi, że delegacja będzie tak niezawodna jak git status.

Najlepsze

Ranking

Ulubione