المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Max Ryabinin
@togethercompute التعلم العميق والبحث على نطاق واسع
مؤلف Learning@home / Hivemind (DMoE ، DeDLOC ، SWARM ، Petals)
دكتوراه في DL اللامركزية '2023
من تجربتي ، قد يكون الحصول على ورقة عن DL اللامركزي مقبولة في مؤتمرات عالية المستوى أمرا صعبا للغاية. الدافع ليس مألوفا للعديد من المراجعين ، ولا تأخذ إعدادات التجربة القياسية في الاعتبار المشكلات التي تهدف إلى حلها.
ومن ثم ، فأنا متحمس جدا لرؤية شركات مثل @PluralisHQ و @PrimeIntellect تستثمر الجهد لمشاركة نتائجها ونشرها في المؤتمرات الكبرى! حتى IMO ، حتى إعداد التقديم ، يجبرك على أن تكون أكثر صرامة بشأن تجاربك + التعليقات الخارجية من المراجعين يساعدك على شحذ رسالة الورقة.

Alexander Long14 يوليو، 08:24
For people not familiar with AI publishing; there are 3 main conferences every year. ICML, ICLR and NeurIPS. These are technical conferences and the equivalent of journals in other disciplines - they are the main publishing venue for AI. The competition to have papers at these conferences is now at a ridiculous level, getting papers accepted is very hard, and there is a lot of concern about the review process which is quite noisey at this point. A strong paper with no flaws has around a 50% chance of being accepted, and typically a paper is submitted with reviewer changes several times until it is accepted. Despite all that, papers in these venues remain the primary stamp of legitimacy in AI world, and are probably still the primary career metrics for ML researchers (although this is weakening imo as so much of the research in the frontier labs is unpublished).
Main Track papers are significantly different to workshop papers. The main track has intense, serious peer review. Workshop papers are for preliminary work, that give some indication of an interesting result, but are either not complete or the result is not significant enough for main track. They are only required to be reviewed by the workshop reviewer pool and they don’t appear in proceedings.
Many great papers have first shown up in workshops (e.g. grokking) - but workshop and main track papers are fundamentally different things, with a fundamentally different level of impact. The only two companies in decentralised AI that have main track papers this year are @PrimeIntellect and Pluralis.
7.28K
Max Ryabinin أعاد النشر
@gowthami_s @JangLawrenceK @IAmTimNguyen @ishapuri101 التدريب الموزع في التعلم🌍 الآلي
انضم إلينا في 12 يوليو حيث يستكشف @Ar_Douillard الأساليب الرئيسية مثل FSDP و Pipeline & Expert Parallelism ، بالإضافة إلى الأساليب الناشئة مثل DiLoCo و SWARM - مما يدفع حدود التدريب العالمي الموزع.
التعرف على المزيد:

7.27K
شكرا جزيلا لفرديناند على استضافة هذه المحادثة! لقد كانت فرصة رائعة لإلقاء نظرة عامة على جميع أجزاء SWARM ومناقشة الدافع وراءها بعمق.
آمل أن يجعل هذا الفيديو DL اللامركزي أكثر سهولة: العديد من الأفكار في هذا المجال أبسط مما تبدو!

Ferdinand Mom12 يونيو 2025
مراجعة فيديو الورقة البحثية حول "التوازي السرب" جنبا إلى جنب مع المؤلف @m_ryabinin ، عالم الأبحاث المتميز @togethercompute قد صدر الآن! الرابط أدناه 👇
بالنسبة للسياق ، يتبع معظم التدريب اللامركزي اليوم مناهج نمط DDP تتطلب تكرارا كاملا للنموذج على كل عقدة. على الرغم من أنه عملي بالنسبة لأولئك الذين لديهم مجموعات H100 تحت تصرفهم ، إلا أن هذا لا يزال بعيدا عن متناول الغالبية العظمى من المساهمين المحتملين ، وهذا هو المكان الذي يكون فيه SWARM مفيدا!

3.13K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز