قد يكون DeepSeek R1 هو المرة الأولى التي تحصل فيها على القطعة الأثرية الجاهزة ثلاث تقارير تقنية مختلفة – أصلي، مقال في *Nature*، ومراجعة كاملة. الكثير من التقنيات موضحة هنا، الأشعة تحت السطحية، المحفزات... لكن الفائز الأكبر؟ @TheZvi! هم *في الواقع* مدركون أن السلامة أمر موجود.
机器之心 JIQIZHIXIN
机器之心 JIQIZHIXIN‏7 يناير، 15:39
تم تحديث ورقة DeepSeek-R1 قبل يومين، حيث تم توسيعها من 22 صفحة إلى 86 صفحة وأضافت كمية كبيرة من التفاصيل. يغطي المحتوى الجديد مواضيع مثل التطور الذاتي ل DeepSeek-R1-Zero، وتقييم DeepSeek-R1، والتحليل الإضافي، وتقطير DeepSeek-R1. DeepSeek-R1: تحفيز قدرة التفكير في نماذج اللغة الكبيرة من خلال التعلم المعزز الورقة:
في 31 يناير، @EpochAIResearch قدمت تقديرا لتكاليف العائد الذي دخل في R1. منذ صحيفة Nature كنا نعلم أن الميزانية الكلية تتجاوز ثلاثة أضعاف. خطأ كيف بالضبط؟ - الدفعة المفترضة = 1024 & حجم المجموعة = 64، كما في DeepSeekMath. حقا: B=512، G=16. - فقط 1700 خطوة ل R1.
@EpochAIResearch بالطبع @EgeErdil2 محسوب جيدا ودقيق معرفيا، لذا كان يعرف بالضبط ما الذي من المحتمل أن يحدث
@EpochAIResearch @EgeErdil2 أعتقد أن ما فعلته Ege خطأ هو التقليل من تقديرهم لأنهم كانوا واضحين جدا أنه لم يكن ناجحا على النماذج الصغيرة (يتبادلون تفاصيل أكثر الآن؛ r1-lite-preview ربما كان Qwen2.5-32B). كان Ergo V3 أكثر كفاءة في استخدام العينات. مستوى ميتا أما السابق فهو أكثر إثارة للاهتمام. هل كانوا متأخرين؟
‏‎815‏