متجر التطبيق اللامركزي | مركز Web3 للأحداث والألعاب

المواضيع الرائجة

الفضل ل OpenAI وAnthropic في إبراز المشكلة: يمكن الذكاء الاصطناعي أن يزور اختباراته الخاصة. كيف يمكن الذكاء الاصطناعي أن يعرف أنه يخضع للاختبار؟ خمسة علامات رئيسية.

اخبر #1: إشارات تفاصيل غير صحيحة في إعداد الاختبار. إذا كنت تختبر ما إذا كان الذكاء الاصطناعي سينتشر عبر الإنترنت، فمن الأفضل أن تكون الملفات كبيرة بما يكفي لتبدو واقعية.

اخبر #3: التلوث النموذج شهد الاختبار من قبل. للأسف، بمجرد نشر الاختبارات عبر الإنترنت، يصبح من الصعب منع النموذج من معرفة بها.

خبر #4: المحفزات المفقودة الاختبار يفتقد تسلسل الإطلاق المتوقع للسلوك السيئ. ربما يعلم الذكاء الاصطناعي أنه لن يحاول الهروب أبدا دون تعطيل المراقبة أولا. إذا كانت المراقبة لا تزال نشطة، فلا بد أن هذا اختبار.

أخبر #5: العواقب أفعال النموذج لا تحمل العواقب المتوقعة؛ عجلة القيادة الخاصة بها معطلة. إذا سمحنا للنموذج بالتأثير على العالم أثناء الاختبار، فلن يكون الاختبار آمنا بنفس القدر. إذا لم نفعل، قد يكون الاختبار واضحا.

‏‎24.55‏K

الأفضل

المُتصدِّرة

التطبيقات المفضلة