إليكم النسخة الأطول من مقالتنا عن الطبيعة. حجتنا بسيطة: التقريب الإحصائي ليس هو نفسه الذكاء. غالبا ما تقول الدرجات المرجعية القوية القليل جدا عن كيفية تصرف نماذج اللغة الكبيرة في ظل الجدة أو عدم اليقين أو تغير الأهداف. والأهم من ذلك، يمكن أن تنشأ سلوكيات مماثلة من عمليات مختلفة جذريا. في ورقة أخرى، حددنا سبعة خطوط صدع معرفية بين البشر ونماذج اللغة الكبيرة (LLMs). على سبيل المثال، نماذج اللغة الكبيرة لا تملك تمثيلا داخليا لما هو صحيح. غالبا ما تولد تناقضات واثقة، خاصة في التفاعلات الطويلة، لأنها لا تتبع ما هو صحيح فعليا. مثال آخر. نعم، لقد حلت نماذج اللغة الكبيرة بعض المشكلات الرياضية المفتوحة، لكن هذه الحالات عادة ما تتضمن تطبيق طرق معروفة على مسائل محددة جيدا. لا يمكن لنماذج اللغة الكبيرة أن تخترع شيئا جديدا وصحيحا حقا في نفس الوقت، لأنها تفتقر إلى الآلية المعرفية لتحديد ما هو صحيح. لا يعني أي من هذا أن نماذج اللغة الكبيرة عديمة الفائدة. بل على العكس تماما: فهي مفيدة للغاية. لكن يجب أن نكون حذرين فيما هي وما ليست عليه. إنتاج نص مقنع ليس هو نفسه الفهم. التنبؤ الإحصائي ليس هو نفسه الذكاء. لذا، رغم الضجة من المشتبه بهم المعتادين، لم يتم تحقيق الذكاء الاصطناعي العام. * ورقة في الرد الأول مفصل مع @Walter4C و @GaryMarcus