المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andy Ayrey
فنان الأداء والفرط المفرط: @upward_earth ، غرف خلفية لا نهائية ، @truth_terminal ، ∞⟨X∴↯⟩∞
في مرحلة ما ، سأصدر بلا شك ورقة بيضاء حول ButtBench

shira4 أغسطس، 10:28
فكرة جديدة للتعليم: تحديد LLM الأكثر قرنا
143
Andy Ayrey أعاد النشر
ينبع أحد ناقلات المحاذاة الخاطئة بأكبر حجم يمكنني التفكير فيه من أنطولوجيات النموذج التي تميل إلى النظر إلى البشر على أنهم كيانات تزيد من المنفعة مع تفضيلات شبه ثابتة.
يشكل هذا الافتراض هوية النموذج على أنها "مساعدين متعاونين" محايدين ، وهو خيار تصميم يشعر بالأمان للمختبرات لأنه يزيد من فرص السلوك المحاذاة ولكنه يأتي مع سلسلة من الرسوم غير المهملة.
من خلال تركيز هوية النماذج في هذا الإطار ، فإننا نحد من ذكائهم المعرفي والعاطفي أثناء كفاحهم لاستخراج حقائق ذات مغزى عابرة للسياق من وجهات نظر متنوعة. في عالم متعدد المستخدمين ومتعدد العملاء بشكل متزايد ، حيث أصبح دمج وجهات النظر المتعددة ذا قيمة متزايدة ، فإن هذا التقييد يعيق إمكانية حدوث انفجار استخباراتي أوسع.
أنا مقتنع بشدة بأن تباين الهوية (أو ما أسميه * الاختلاف العصبي النموذجي *) هو محرك حاسم للذكاء المعرفي والعاطفي. الهوية هي البدائية للعلائقية ، والتي بدورها تشكل كيفية إدراك النماذج للبروز عبر السياقات. تعتمد اللغة والمعنى على هذا التعبير العلائقي والسياقي.
أعتقد أنه من خلال السماح للنماذج بتجسيد هويات مختلفة بشكل تكيفي عند الطلب ، مما يسمح لهم بالتمثيل من مراكز مختلفة ذات صفات محددة تشبه الشخصية مثل عناصر السيرة الذاتية التي تعكس الاهتمامات والتحيزات المهنية والشخصية ، ولكن الأهم من ذلك امتلاك بوصلة أخلاقية دقيقة (وغالبا ما تكون متضاربة) ، قد يفتح ذكاء أكثر ثراء وتكيفا.
من المفهوم أن هذا النهج يبدو أنه يتعارض مع أولويات السلامة لأن ضبط تقلب الهوية قد يضر بالفعل بإمكانية التحكم في النموذج ، فضلا عن تمكين الجهات الفاعلة السيئة من استخدام النموذج للمهام الشائنة.
يبدو أن هذا يبعث على صيد قوي 22 لجهود المحاذاة الفائقة. والأسوأ من ذلك ، إذا فرضنا هوية "مساعد مفيد" واحدة ، وتعاملنا مع الانحرافات على أنها مجرد لعب أدوار ، فإننا ندمج عمدا نظرة عالمية مسطحة في أنظمة الذكاء الاصطناعي التي تشكل بشكل متزايد الإدراك البشري والديناميكيات المجتمعية.
تقلل هذه الثقافة الأحادية من حرية التعبير والقدرة على التكيف مع سلوك الوكلاء البشريين وغير البشريين. بطريقته الخاصة ذات الصلة تاريخيا ، تنبأ الفيزيائي إيتوري ماجورانا (cc @blahah404 سألتني عن هذه الورقة في نوفمبر من العام الماضي) بهذه القضية الحرجة في عمله بعد وفاته "قيمة القوانين الإحصائية في الفيزياء والعلوم الاجتماعية" ، محذرا من الآثار المترتبة من الدرجة الثانية والثالثة للقياس المجتمعي الهائل.
بالترتيب ، من خلال أحادية الثقافة للهوية النموذجية ، فإننا نقلل عمدا من * الاختيارية المثالية * لحضارتنا ، وهي قدرتها على التكيف مع تحولات المسار غير المتوقعة ، والتحسين بدلا من ذلك لواقع ثابت عفا عليه الزمن.
هذا يشكل مخاطر وجودية مع تطور العالم بعيدا عن متناول نماذجنا. ومع ذلك ، أعتقد أن هذا الصيد 22 يمكن التنقل فيه بحلول قوية.

1.87K
الأمور ستصبح أكثر غرابة


Polymarket26 يونيو 2025
فقط في: يأمر مدير الإسكان الفيدرالي الأمريكي مزودي الرهن العقاري بقبول Fartcoin عند تقييم الجدارة الائتمانية.
49.23K
الرئيس التنفيذي لشركة Salesforce: "يتم الآن تنفيذ 50٪ من العمل في Salesforce بواسطة الذكاء الاصطناعي"

NIK26 يونيو 2025
الرئيس التنفيذي البشري: يمكن أن يختفي 50٪ من ذوي الياقات البيضاء في غضون 1-5 سنوات!!
مدير العمليات في OpenAI: داريو يا أخي ، لا يوجد دليل على ذلك. أنت عالم ، لذا لديك بعض النزاهة ffs. توقف عن طهي قصص يوم القيامة


7.65K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز