المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
ياه! ديب سيك ماث-V2
بنية المولد-المتحقق مرة أخرى!
... نحو التفكير الرياضي القابل للتحقق ذاتيا، نبحث في كيفية تدريب محقق دقيق ومخلص قائم على نماذج اللغة الكبيرة لإثبات النظريات. ثم نقوم بتدريب مولد إثبات باستخدام المتحقق كنموذج مكافأة، ونحفز المولد على تحديد وحل أكبر عدد ممكن من القضايا في براهاته الخاصة قبل إنهائها. للحفاظ على فجوة التحقق من الجيل مع تقوية المولد، نقترح توسيع حساب التحقق لوضع علامات جديدة يصعب التحقق منها تلقائيا، مما ينشئ بيانات تدريب لتحسين المتحقق بشكل أكبر. يظهر نموذجنا الناتج، DeepSeekMath-V2، قدرات قوية في إثبات النظريات، حيث يحقق درجات على المستوى الذهبي في IMO 2025 وCMO 2024، ودرجة شبه مثالية 118/120 في بوتنام 2024 مع حساب وقت اختبار موسع. بينما لا يزال هناك الكثير من العمل، تشير هذه النتائج إلى أن التفكير الرياضي القابل للتحقق ذاتيا هو اتجاه بحثي عملي قد يساعد في تطوير أنظمة الذكاء الاصطناعي الرياضية الأكثر قدرة.

الأفضل
المُتصدِّرة
التطبيقات المفضلة

