Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
El fin de semana pasado publiqué que Claude Code creó un estudio completo de ciencia política empírica en una hora. Mucha gente preguntó: ¿pero qué tan preciso fue el estudio?
La respuesta: bastante precisa, con algunos errores interesantes y limitaciones importantes.
Para obtener la respuesta, Graham Straus amablemente se ofreció a hacer una auditoría independiente y manual—recopilando los mismos datos y ampliando el artículo como hizo Claude, pero sin usar ninguna IA. Esto es lo que descubrió:
Claude replicó exactamente el artículo original, codificó correctamente 29 de 30 condados de California en cuanto al momento del tratamiento y recopiló datos electorales que correlacionaban >,999 con la recogida manual.
Los tres principales errores que encontró Graham—codificar mal el año de tratamiento de un condado, omitir la recopilación de datos de varias contiendas potencialmente relevantes en estados siempre tratados y no utilizar elecciones no presidenciales para calcular la participación—son similares a los tipos de errores que un humano podría cometer en una primera vez al escribir este artículo, y tuvieron solo pequeños efectos en las estimaciones posteriores.
Por otro lado, cuando Claude intentó crear nuevos análisis que no fueran extensiones directas del artículo original, lo hizo peor. No hubo alucinaciones ni errores locos, en sí, pero se desvió del prompt y produjo resultados que encontramos mal concebidos.
Mi lectura:
–La IA hoy en día ya es una forma extremadamente poderosa de actualizar y ampliar rápidamente artículos empíricos simples y bien contenidos.
–Para realizar bien investigación empírica en ciencias sociales, necesita absolutamente orientación y supervisión de expertos humanos.
La próxima semana compartiremos reflexiones más amplias sobre este trabajo, lo que aprendimos al hacerlo y hacia dónde vamos a partir de aquí en mi blog. Gracias a las muchas, muchísimas personas que se pusieron en contacto, hicieron preguntas y ofrecieron su opinión sobre este proyecto.


4 ene, 08:01
Here's proof that Claude Code can write an entire empirical polisci paper.
To validate my claim that AI agents are coming for polisci "like a freight train", today I had Claude Code fully replicate and extend an old paper of mine estimating the effect of universal vote-by-mail on turnout and election outcome...essentially in one shot.
After careful prompting, Claude Code:
(1) Downloaded the old paper's repo and replicated the past results, translating our old Stata Code into Python
(2) Crawled the web to get updated official election data and census data
(3) Ran new analyses extending the results through 2024
(4) Created new tables and figures
(5) Performed a lit review
(6) Wrote a wholly new paper
(7) Pushed the whole thing to a new github repo
The whole thing took about an hour.
This is an insane paradigm shift in how empirical work is done.
It also validates the point that several people including @BrendanNyhan made yesterday---it's going to be especially easy to scale observational research with AI.
Thanks to @alexolegimas, @arthur_spirling , and many others who gave me feedback. .

Un artículo completo está disponible aquí:
¡Es interesante combinarlo con escritos recientes de @joshgans @alexolegimas @deanwball y otros!
286
Populares
Ranking
Favoritas