المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
عبقرية @karpathy تكمن في القدرة على تلخيص مفاهيم معقدة للغاية وجعلها سهلة الفهم وتنفيذها على نطاق صغير.
كل ما تطلبه الأمر هو كود كلود و10 دولارات على @runpod لتشغيل جهاز H100 واحد، وكان لدي باحث تعلم آلي عالمي المستوى يعمل بشكل آلي.
أنا آخذ المفهوم العام للبحث التلقائي وأطبقه على خط أنابيب استنتاجات أعمل عليه (ولحسن الحظ لا أحتاج إلى بطاقة الرسوميات). كل شيء أصبح ممتعا جدا الآن.


8 مارس، 03:53
قمت بتجميع مشروع "البحث التلقائي" في مستودع جديد مستقل وبسيط إذا أراد الناس اللعب خلال عطلة نهاية الأسبوع. هي في الأساس نواة تدريب لنماذج اللغة الكبيرة في الدردشة النانوية محصورة إلى وحدة معالجة رسومات واحدة، نسخة ملف واحد تحتوي على ~630 سطرا من الكود، ثم:
- التكرار البشري على الموضوع (.md)
- يقوم وكيل الذكاء الاصطناعي بتعديل كود التدريب (.py)
الهدف هو هندسة وكلائك لتحقيق أسرع تقدم بحثي إلى أجل غير مسمى ودون أي تدخل من نفسك. في الصورة، كل نقطة هي دورة تدريبية كاملة لنموذج اللغة الكبيرة تستغرق بالضبط 5 دقائق. يعمل الوكيل في حلقة مستقلة على فرع ميزات git ويجمع التزامات git في سكريبت التدريب أثناء بحثه عن إعدادات أفضل (بانخفاض فقدان التحقق في النهاية) لبنية الشبكة العصبية، والمحسن، وجميع المعاملات الفائقة، وغيرها. يمكنك أن تتخيل مقارنة تقدم البحث في مواضيع مختلفة، ووكلاء مختلفين، وما إلى ذلك.
جزء منها برمجة، جزء خيال علمي، وقليل من الذهان :)

@karpathy @runpod بحاجة إلى أصدقاء مثل @ryaneshea ليزيل أعذارك (الضعيفة) لتجنب القيام بالأشياء فقط

508
الأفضل
المُتصدِّرة
التطبيقات المفضلة
