في نهاية الأسبوع الماضي نشرت أن كلود كود أنشأ دراسة كاملة في العلوم السياسية التجريبية خلال ساعة. سأل الكثيرون: ما مدى دقة الدراسة؟ الإجابة: دقيقة جدا، مع بعض الأخطاء المثيرة للاهتمام والقيود المهمة. للحصول على الإجابة، عرض غراهام ستراوس بلطف إجراء تدقيق مستقل ويدوي—يجمع نفس البيانات ويوسع الورقة كما فعل كلود، ولكن دون استخدام أي الذكاء الاصطناعي. إليك ما وجده: كرر كلود الورقة الأصلية بدقة، وتم ترميز 29/30 مقاطعة في كاليفورنيا بشكل صحيح على توقيت العلاج، وجمع بيانات انتخابية ربطت >.999 بالجمع اليدوي. الأخطاء الثلاثة الرئيسية التي وجدها غراهام—مثل ترميز سنة معالجة مقاطعة بشكل خاطئ، وحذف جمع البيانات لعدة سباقات محتملة ذات صلة في الولايات التي تتم التعامل معها دائما، وعدم استخدام الانتخابات غير الرئاسية لحساب نسبة المشاركة — تشبه أنواع الأخطاء التي قد يرتكبها الإنسان في المحاولة الأولى لكتابة هذه الورقة، وكان لها تأثيرات طفيفة فقط على التقديرات اللاحقة. من ناحية أخرى، عندما حاول كلود إنشاء تحليلات جديدة لم تكن امتدادا مباشرا للورقة الأصلية، كان ذلك أسوأ. لا هلوسات أو أخطاء مجنونة بالمعنى الحرفي، لكنها انحرفت عن الموضوع وأنتجت نتائج وجدناها غير مخططة. قراءتي: –الذكاء الاصطناعي اليوم هو بالفعل وسيلة قوية للغاية لتحديث وتوسيع الأوراق التجريبية البسيطة والمحتوية جيدا. –لكي يتم إجراء أبحاث تجريبية في العلوم الاجتماعية بشكل جيد، فهي بالتأكيد بحاجة إلى إرشاد وإشراف من خبراء بشريين. سنشارك أفكارا أوسع حول هذا العمل، وما تعلمناه من خلال القيام به، وإلى أين سنتجه من هنا الأسبوع القادم في مدونتي. شكرا للعديد من الأشخاص الذين تواصلوا معهم، وطرحوا الأسئلة، وقدموا ملاحظاتهم حول هذا المشروع.
Andy Hall
Andy Hall‏4 يناير، 08:01
إليك دليل على أن كلود كود يمكنه كتابة ورقة كاملة في العلوم السياسية التجريبية. ولإثبات ادعائي بأن عملاء الذكاء الاصطناعي يأتون إلى العلوم السياسية "مثل قطار شحن"، اليوم طلبت من كلود كود أن يكرر ويود ورقة قديمة لي تقدر تأثير التصويت الشامل عبر البريد على نسبة المشاركة ونتائج الانتخابات... في الأساس في لقطة واحدة. بعد تحفيز دقيق، كود كلود: (1) حملنا مستودع الورقة القديمة ونسخنا النتائج السابقة، وترجمنا كود ستاتا القديم إلى بايثون (2) زحف على الإنترنت للحصول على بيانات الانتخابات الرسمية وبيانات التعداد المحدثة (3) أجرى تحليلات جديدة لتمديد النتائج حتى عام 2024 (4) إنشاء جداول وأشكال جديدة (5) أجرى مراجعة أدبية (6) كتب ورقة بحثية جديدة تماما (7) نقلت كل شيء إلى مستودع جديد على GitHub استغرق الأمر كله حوالي ساعة. هذا تحول جذري في طريقة العمل التجريبي. كما يؤكد النقطة التي ذكرها عدة أشخاص بمن فيهم @BrendanNyhan أمس---سيكون من السهل بشكل خاص توسيع نطاق البحث الرصدي باستخدام الذكاء الاصطناعي. شكرا ل @alexolegimas و@arthur_spirling والعديد من الآخرين الذين قدموا لي ملاحظات. .
يتوفر الوصف الكامل هنا: من المثير للاهتمام أن أجمع بين الكتابات الحديثة من @joshgans @alexolegimas @deanwball وآخرين!
‏‎223‏