المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
ورقة بحثية رائعة.
🚨 نماذج اللغة الكبيرة سيئة جدا في الردود. توضح هذه الورقة بالضبط السبب.
معظم أدوات الذكاء الاصطناعي تعامل الردود كمهمة كتابة. أنشئ نصا مهذبا. يبدو واثقا. تقدم.
لهذا السبب بالذات يفشلون في المؤتمرات الكبرى.
هذا البحث يقلب مشكلة الرد رأسا على عقب.
بدلا من "توليد رد"، يتعامل مع الردود كمهمة قرار + دليل.
النظام، المسمى RebuttalAgent، هو خط أنابيب متعدد الوكلاء يرفض كتابة أي شيء حتى يصبح المنطق محكما.
أولا، يقوم بتحليل ملاحظات المراجعين. كل فقرة غامضة تقسم إلى مخاوف دقيقة وقابلة للتنفيذ. لم تفوت أي نقاط. لا تجمع النقد غير المرتبط معا. يتم تطبيق التغطية قبل حدوث أي شيء آخر.
بعد ذلك يأتي الابتكار الحقيقي: التفكير الذي يعتمد على الأدلة أولا.
لكل اهتمام، يبني النظام سياقا هجينا. معظم الورقة تبقى مضغوطة لحفظ الرموز، لكن الأقسام ذات الصلة بتعليق المراجع تتوسع بدقة كاملة. إذا لم تكن الأدلة الداخلية كافية، يقوم وكيل البحث عند الطلب باسترجاع الأوراق الخارجية وتحويلها إلى ملخصات جاهزة للاستشهاد. لا يتم الاستشهاد به إلا إذا كان قابلا للتتبع.
ثم تأتي الخطوة التي تتخطاها معظم أدوات LLM تماما: التحقق من الاستراتيجية.
قبل صياغته، يقوم RebuttalAgent بإنشاء خطة رد صريحة. يفصل:
ما الذي يمكن توضيحه باستخدام النتائج الحالية
ما يتطلب حقا تجارب جديدة
ما الذي يجب الاعتراف به دون الالتزام الزائد
يقوم وكيل الفحص بمراجعة هذه الخطة للتأكد من الاتساق المنطقي وسلامة الالتزام. إذا كان الرد يوحي بنتائج غير موجودة، يتم حجبه. الهلوسات تموت هنا....
الأفضل
المُتصدِّرة
التطبيقات المفضلة
