المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
إطار عمل ذاتي التطور لاكتشاف وصقل مهارات الوكلاء.
معظم مهارات الوكيل التي أراها اليوم مصنوعة يدويا أو مصممة بشكل سيء من قبل وكيل.
تبدو أنظمة الوكلاء المتعددة لبناء المهارات واعدة.
تقدم هذه الورقة إفوسكيل، إطار عمل ذاتي التطور يكتشف ويحسن مهارات الوكلاء تلقائيا من خلال تحليل الفشل التكراري.
يحلل EvoSkill إخفاقات التنفيذ، ويقترح مهارات جديدة أو تعديلات على المهارات الموجودة، ويجسدها في مجلدات مهارات منظمة وقابلة لإعادة الاستخدام.
ثلاثة عملاء متعاونين يقودون العملية بأكملها.
منفذ يدير المهام، مقترح يشخص الإخفاقات، ومنشئ المهارات الذي ينشئ مجلدات مهارات ملموسة.
حدود باريتو تحكم الاختيار، مع الاحتفاظ فقط بالمهارات التي تحسن أداء التحقق الثابت مع إبقاء النموذج الأساسي مجمدا.
على OfficeQA، يحسن EvoSkill دقة Claude Code مع Opus 4.5 من 60.6٪ إلى 67.9٪ في المطابقة الدقيقة. على SealQA، تحقق مكاسب بنسبة 12.1٪. المهارات التي تطورت في SealQA ونقلت بدون طلقة إلى BrowseComp، مما حسن الدقة بنسبة 5.3٪ دون تعديل.
سأواصل متابعة هذا الخط من البحث عن كثب. أعتقد أن هذا مهم جدا.
الورقة:
تعلم كيفية بناء وكلاء ذكاء اصطناعي فعالين في أكاديميتنا:

الأفضل
المُتصدِّرة
التطبيقات المفضلة
