Aquí está la prueba de que Claude Code puede escribir un artículo completo de ciencias políticas empírico. Para validar mi afirmación de que los agentes de IA vienen por las ciencias políticas "como un tren de carga", hoy hice que Claude Code replicara y ampliara completamente un viejo artículo mío que estima el efecto de la votación universal por correo en la participación y el resultado electoral... esencialmente en un solo intento. Después de un cuidadoso prompting, Claude Code: (1) Descargó el repositorio del viejo artículo y replicó los resultados anteriores, traduciendo nuestro antiguo código de Stata a Python (2) Navegó por la web para obtener datos oficiales de elecciones actualizados y datos del censo (3) Realizó nuevos análisis ampliando los resultados hasta 2024 (4) Creó nuevas tablas y figuras (5) Realizó una revisión de la literatura (6) Escribió un artículo completamente nuevo (7) Subió todo a un nuevo repositorio de github Todo esto tomó aproximadamente una hora. Este es un cambio de paradigma increíble en cómo se realiza el trabajo empírico. También valida el punto que varias personas, incluyendo a @BrendanNyhan, hicieron ayer: será especialmente fácil escalar la investigación observacional con IA. Gracias a @alexolegimas, @arthur_spirling y muchos otros que me dieron retroalimentación.
Andy Hall
Andy Hall3 ene, 06:46
Claude Code y sus similares están llegando al estudio de la política como un tren de carga. Un solo académico va a poder escribir miles de artículos empíricos (especialmente experimentos de encuestas o experimentos de LLM) por año. Claude Code ya puede esencialmente generar de un solo golpe un artículo completo de experimento de encuesta al estilo AJPS (con acceso a la API de Prolific). Tendremos que encontrar nuevas formas de organizar y difundir la investigación en ciencias políticas en un futuro muy cercano para hacer frente a este diluvio.
Algunas notas para más tarde: --Este fue probablemente el caso más fácil ya que solo implicaba extender un análisis simple con datos públicos. --Claude no pudo actualizar algunas de nuestras estimaciones de participación/modo que dependían de datos de archivos de votantes propietarios (en principio, Claude podría solicitar y acceder a estos datos, pero sería muy complicado) --El primer esfuerzo de Claude en el diseño del evento no fue correcto. --Le di a Claude instrucciones sobre qué paquete de Python usar para acercarse lo más posible al paquete reghdfe de Stata. --Algunas cosas siguientes a probar: extensiones más complejas que requieren una recolección de datos más novedosa y métodos de análisis más novedosos.
Y aquí está el repositorio:
288