المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
قد يكون DeepSeek R1 هو المرة الأولى التي تحصل فيها على القطعة الأثرية الجاهزة ثلاث تقارير تقنية مختلفة – أصلي، مقال في *Nature*، ومراجعة كاملة. الكثير من التقنيات موضحة هنا، الأشعة تحت السطحية، المحفزات... لكن الفائز الأكبر؟ @TheZvi! هم *في الواقع* مدركون أن السلامة أمر موجود.


7 يناير، 15:39
تم تحديث ورقة DeepSeek-R1 قبل يومين، حيث تم توسيعها من 22 صفحة إلى 86 صفحة وأضافت كمية كبيرة من التفاصيل.
يغطي المحتوى الجديد مواضيع مثل التطور الذاتي ل DeepSeek-R1-Zero، وتقييم DeepSeek-R1، والتحليل الإضافي، وتقطير DeepSeek-R1.
DeepSeek-R1: تحفيز قدرة التفكير في نماذج اللغة الكبيرة من خلال التعلم المعزز
الورقة:


في 31 يناير، @EpochAIResearch قدمت تقديرا لتكاليف العائد الذي دخل في R1. منذ صحيفة Nature كنا نعلم أن الميزانية الكلية تتجاوز ثلاثة أضعاف. خطأ كيف بالضبط؟
- الدفعة المفترضة = 1024 & حجم المجموعة = 64، كما في DeepSeekMath. حقا: B=512، G=16.
- فقط 1700 خطوة ل R1.


@EpochAIResearch بالطبع @EgeErdil2 محسوب جيدا ودقيق معرفيا، لذا كان يعرف بالضبط ما الذي من المحتمل أن يحدث

@EpochAIResearch @EgeErdil2 أعتقد أن ما فعلته Ege خطأ هو التقليل من تقديرهم لأنهم كانوا واضحين جدا أنه لم يكن ناجحا على النماذج الصغيرة (يتبادلون تفاصيل أكثر الآن؛ r1-lite-preview ربما كان Qwen2.5-32B). كان Ergo V3 أكثر كفاءة في استخدام العينات.
مستوى ميتا أما السابق فهو أكثر إثارة للاهتمام. هل كانوا متأخرين؟


815
الأفضل
المُتصدِّرة
التطبيقات المفضلة
