Her er bevis på at Claude Code kan skrive en hel empirisk statsvitenskapelig artikkel. For å bekrefte påstanden min om at AI-agenter kommer for statsvitenskap «som et godstog», fikk jeg i dag Claude Code til å fullstendig replikere og utvide en gammel artikkel jeg har som estimerer effekten av universell postavstemning på valgdeltakelse og valgresultat... I praksis på én gang. Etter nøye oppfordring, Claude Code: (1) Lastet ned det gamle papirets repo og replikerte tidligere resultater, og oversatte vår gamle Stata-kode til Python (2) Crawlet nettet for å få oppdaterte offisielle valg- og folketellingsdata (3) Kjørte nye analyser som utvidet resultatene til 2024 (4) Opprettet nye tabeller og figurer (5) Utførte en litteraturgjennomgang (6) Skrev en helt ny artikkel (7) Flyttet hele greia til et nytt github-repo Hele greia tok omtrent en time. Dette er et sinnssykt paradigmeskifte i hvordan empirisk arbeid utføres. Det bekrefter også poenget som flere, inkludert @BrendanNyhan, tok opp i går--- det blir spesielt lett å skalere observasjonsforskning med AI. Takk til @alexolegimas, @arthur_spirling og mange andre som ga meg tilbakemeldinger. .
Andy Hall
Andy Hall3. jan., 06:46
Claude Code og lignende kommer for å studere politikk som et godstog. En enkelt akademiker vil kunne skrive tusenvis av empiriske artikler (spesielt undersøkelseseksperimenter eller LLM-eksperimenter) per år. Claude Code kan allerede i praksis fullføre et fullstendig AJPS-lignende undersøkelseseksperiment (med tilgang til Prolific API). Vi må finne nye måter å organisere og spre statsvitenskapelig forskning på i nær fremtid for denne flommen.
Noen få notater til senere: --Dette var sannsynligvis det enkleste tilfellet siden det bare innebar å utvide en enkel analyse med offentlige data. --Claude klarte ikke å oppdatere noen av våre oppmøte-/modusestimater som var avhengige av proprietære velgerfiler (i prinsippet kunne Claude be om og få tilgang til disse dataene, men det ville vært veldig komplisert) --Claudes første forsøk på arrangementsdesignet var ikke riktig --Jeg ga Claude instruksjoner om hvilken Python-pakke han skulle bruke for å komme så nær Statas reghdfe-pakke som mulig --Noen neste ting å prøve: mer komplekse utvidelser som krever mer ny datainnsamling og flere nye analysemetoder
Og her er repoet:
292