متجر التطبيق اللامركزي | مركز Web3 للأحداث والألعاب

المواضيع الرائجة

قد يكون DeepSeek R1 هو المرة الأولى التي تحصل فيها على القطعة الأثرية الجاهزة ثلاث تقارير تقنية مختلفة – أصلي، مقال في *Nature*، ومراجعة كاملة. الكثير من التقنيات موضحة هنا، الأشعة تحت السطحية، المحفزات... لكن الفائز الأكبر؟ @TheZvi! هم *في الواقع* مدركون أن السلامة أمر موجود.

في 31 يناير، @EpochAIResearch قدمت تقديرا لتكاليف العائد الذي دخل في R1. منذ صحيفة Nature كنا نعلم أن الميزانية الكلية تتجاوز ثلاثة أضعاف. خطأ كيف بالضبط؟ - الدفعة المفترضة = 1024 & حجم المجموعة = 64، كما في DeepSeekMath. حقا: B=512، G=16. - فقط 1700 خطوة ل R1.

@EpochAIResearch بالطبع @EgeErdil2 محسوب جيدا ودقيق معرفيا، لذا كان يعرف بالضبط ما الذي من المحتمل أن يحدث

@EpochAIResearch @EgeErdil2 أعتقد أن ما فعلته Ege خطأ هو التقليل من تقديرهم لأنهم كانوا واضحين جدا أنه لم يكن ناجحا على النماذج الصغيرة (يتبادلون تفاصيل أكثر الآن؛ r1-lite-preview ربما كان Qwen2.5-32B). كان Ergo V3 أكثر كفاءة في استخدام العينات. مستوى ميتا أما السابق فهو أكثر إثارة للاهتمام. هل كانوا متأخرين؟

‏‎815‏

الأفضل

المُتصدِّرة

التطبيقات المفضلة