المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
اليوم نفتح المصدر Nomos 1. بمعايير 30 مليار فقط، حصلت على تقييم 87 من 120 في مسابقات بوتنام لهذا العام، وهي واحدة من أرقى مسابقات الرياضيات في العالم.
هذا التقييم سيصنف #2/3988 في عام 2024 ويمثل خطوتنا الأولى في @hillclimbai نحو إنشاء عالم رياضيات الذكاء الاصطناعي SOTA.

حقق Nomos 1 تقييم 87/120 مع 8 درجات كاملة، بينما حصل Qwen3-30ba3b-Thinking-2507 على 24/120 عند اللعب بنفس الحزام تحت نفس الظروف، مما يشير إلى أن الأداء يعود إلى حد كبير إلى ما بعد التدريب وجودة البيانات وليس إلى الحزام.

تم تقييم المشاركات بشكل أعمى من قبل متسابق بشري ضمن أفضل 200 متسابق في بوتنام تم تقديمه بشكل مجهول.
الملفات الدقيقة التي أرسلت إلى المشرقين البشر لدينا للتصحيح متاحة هنا بعد إزالة الهوية: ، بالإضافة إلى دفاتر التشغيل المستخدمة في إنشائها
استخدمنا نفس الحدود الزمنية التي استخدمها المتسابقون - 3 ساعات لكل من الجزأين.
يتكون نظام التفكير المفتوح المصدر لدينا من مرحلة حل، حيث يحاول العاملون حل مشكلة أقل قدر من الحلول ويقيمون أنفسهم، تليها مرحلة إنهاء تجمع التقديمات لاختيار تقديم نهائي لكل مشكلة. استخدمنا معايير العينة الافتراضية في Qwen3 دون تطبيق موجه للنظام.

نحن نفتح المصدر هنا نموذجنا ونستخدم التفكير.
تم تدريب هذا النموذج من قبل @rogershijin على البنية التحتية التي بنتها @theemozilla @dmayhem93 مع تقديم المشورة من @nullvaluetensor والقيادة من @teknium و@theemozilla.
118.09K
الأفضل
المُتصدِّرة
التطبيقات المفضلة

