المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
يقترح باحثو معهد ماساتشوستس للتكنولوجيا نماذج لغوية تكرارية
ستسمع المزيد عن هذا في عام 2026.
لماذا يهم ذلك؟
ماذا لو كانت نماذج اللغة الكبيرة قادرة على معالجة المدخلات لفترة أطول بمئة مرة من نافذة السياق الخاصة بها؟
طول السياق قيد صارم.
يمكنك تمديده بتغييرات معمارية، لكن هناك دائما حد. تحاول معظم الطرق الضغط على المزيد داخل النافذة أو ضغط ما لا يناسب.
هذا البحث الجديد يتبع نهجا مختلفا. بدلا من مواجهة حد السياق، تعامل معها برمجيا.
نماذج اللغة العودية (RLMs) تعامل المحفزات الطويلة كبيئة خارجية. يمكن للنموذج فحص الطلب، وتفكيكه إلى أقسام، واستدعاء نفسه بشكل متكرر على مقتطفات. إنه مقياس زمني الاستنتاج يطبق على طول السياق.
بدلا من إجبار كل شيء على الانتباه في تمريرة واحدة، دع النموذج يقسم ويعالج المعلومات بشكل استراتيجي عبر عدة استدعاءات متكررة.
النتائج مثيرة للإعجاب. تتعامل وحدات RLM بنجاح مع مدخلات تصل إلى مرتبتين من حجم ما يتجاوز نوافذ سياق النموذج. يمكن للنموذج الذي يحتوي على سياق 8K معالجة 800 ألف رمز بفعالية.
لكن ما هو مفاجئ: حتى في المحفزات القصيرة التي تناسب السياق، تتفوق نماذج RLM بشكل كبير على نماذج اللغة الكبيرة الأساسية والهياكل طويلة السياق الشائعة عبر أربع مهام متنوعة.
هذا يشير إلى شيء مثير للاهتمام.
ربما الانتباه المتسلسل على كامل الإدخال ليس دائما أفضل استراتيجية، حتى عندما يكون ذلك ممكنا تقنيا. قد تكون التحليل البرمجي والمعالجة التكرارية أفضل بشكل أساسي لبعض المهام.
يحقق هذا النهج تكلفة مماثلة أو أرخص لكل استعلام مقارنة بطرق السياق الطويل البديلة.
قيود طول السياق تحد مما يمكن للوكلاء القيام به. معالجة قواعد شيفرة كاملة، أو مستندات طويلة، أو سجلات محادثات مطولة تتطلب حلول بديلة. تقدم نماذج RLM استراتيجية استدلال عامة تحول حدود السياق إلى قيد ناعم بدلا من قيد صارم.

الأفضل
المُتصدِّرة
التطبيقات المفضلة
