مستوحى من البحث التلقائي، جعلت هيرميس-وكيل يجعل نفسه أفضل، إلى ما لا نهاية (نوعا ما). أعطيت هيرميس-وكيل 5090 مستأجرا وQwen3.5:4b وأخبرته أن يكون أفضل وكيل بحث لهيرميس. كان سير العمل المقترح كالتالي: - تشغيل اختبار الأداء على النموذج - أضف QLoRA أو ضبط دقيق -تحميل نموذج إلى ذاكرة النظام -كرر وهكذا، انتهى به الأمر بإنتاج نموذج تفوق على Qwen3.5:27b (وكاد أن يضاعف أدائه) في DeepPlanning (من 17.8 إلى 31.2) والمعايير ذات الصلة أنا متأكد أنه مع وقت أطول (تم إنجاز ذلك في 7 ساعات) يمكن لهذا الطراز أن يتجاوز 31.2 ويستمر في التكرار. هذا تقديم لهاكاثون @NousResearch @Teknium، منتج مذهل لديهم هنا. فيما يلي رسم بياني للتحسين في الضبط الدقيق (الصورة تم إعدادها باستخدام gpt-image-1.5)