Đây là bằng chứng rằng Claude Code có thể viết một bài nghiên cứu khoa học chính trị hoàn chỉnh. Để xác thực tuyên bố của tôi rằng các tác nhân AI đang đến với khoa học chính trị "như một đoàn tàu chở hàng", hôm nay tôi đã yêu cầu Claude Code sao chép và mở rộng một bài viết cũ của tôi ước lượng tác động của việc bỏ phiếu qua thư toàn cầu lên tỷ lệ cử tri và kết quả bầu cử... về cơ bản chỉ trong một lần. Sau khi được hướng dẫn cẩn thận, Claude Code: (1) Tải xuống kho lưu trữ của bài viết cũ và sao chép các kết quả trước đó, chuyển đổi mã Stata cũ của chúng tôi sang Python (2) Lướt web để lấy dữ liệu bầu cử chính thức và dữ liệu điều tra dân số cập nhật (3) Chạy các phân tích mới mở rộng kết quả đến năm 2024 (4) Tạo các bảng và hình ảnh mới (5) Thực hiện một bài tổng quan tài liệu (6) Viết một bài báo hoàn toàn mới (7) Đưa toàn bộ vào một kho lưu trữ github mới Toàn bộ quá trình mất khoảng một giờ. Đây là một sự thay đổi mô hình điên rồ trong cách thực hiện công việc thực nghiệm. Nó cũng xác thực quan điểm mà một số người, bao gồm cả @BrendanNyhan đã nêu ra hôm qua---sẽ đặc biệt dễ dàng để mở rộng nghiên cứu quan sát với AI. Cảm ơn @alexolegimas, @arthur_spirling và nhiều người khác đã cho tôi phản hồi.
Andy Hall
Andy Hall06:46 3 thg 1
Claude Code và những thứ tương tự đang đến với nghiên cứu chính trị như một đoàn tàu chở hàng. Một học giả đơn lẻ sẽ có thể viết hàng nghìn bài báo thực nghiệm (đặc biệt là các thí nghiệm khảo sát hoặc thí nghiệm LLM) mỗi năm. Claude Code hiện đã có thể thực hiện một bài báo thí nghiệm khảo sát theo phong cách AJPS chỉ trong một lần (với quyền truy cập vào Prolific API). Chúng ta sẽ cần tìm ra những cách mới để tổ chức và phổ biến nghiên cứu khoa học chính trị trong tương lai rất gần cho cơn lũ này.
Một vài ghi chú cho sau này: -- Đây có lẽ là trường hợp dễ nhất vì nó chỉ liên quan đến việc mở rộng một phân tích đơn giản với dữ liệu công khai. -- Claude không thể cập nhật một số ước lượng về tỷ lệ cử tri/mode của chúng tôi mà phụ thuộc vào dữ liệu từ danh sách cử tri độc quyền (về nguyên tắc, Claude có thể yêu cầu và truy cập dữ liệu này nhưng sẽ rất phức tạp) -- Nỗ lực đầu tiên của Claude trong việc thiết kế sự kiện là không chính xác -- Tôi đã hướng dẫn Claude về gói Python nào để sử dụng nhằm đạt được gần nhất với gói reghdfe của Stata -- Một số điều tiếp theo cần thử: các mở rộng phức tạp hơn yêu cầu thu thập dữ liệu mới và các phương pháp phân tích mới hơn.
Và đây là kho lưu trữ:
290