المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

hardmaru
بناء @SakanaAILabs 🧠 الذكاء الجماعي
hardmaru أعاد النشر
قبل عقد من الزمان: مهندس سريع للتعلم المعزز في القسم 5.3 من "تعلم التفكير ...» [2]. سلسلة الفكر التكيفية! تتعلم شبكة RL الاستعلام عن شبكة أخرى للتفكير المجرد واتخاذ القرار. تجاوز النموذج العالمي لعام 1990 للتخطيط بالمللي ثانية [1].
[2] ج. شميدهوبر (شبيبة ، 2015). «حول تعلم التفكير: نظرية المعلومات الخوارزمية لمجموعات جديدة من وحدات التحكم في RL ونماذج العالم العصبي المتكررة.» أرشيف 1210.0118
[1] شبيبة (1990). "جعل العالم قابلا للتمييز: حول استخدام الشبكات العصبية المتكررة بالكامل ذاتيا للإشراف من أجل التعلم المعزز الديناميكي والتخطيط في البيئات غير الثابتة." TR FKI-126-90 ، TUM. (قدم هذا التقرير أيضا فضولا مصطنعا ودافعا جوهريا من خلال شبكات الخصومة التوليدية.)

23.34K
hardmaru أعاد النشر
إذا كنت تفكر في نماذج العالم أو المحاكاة العصبية ولا تعرف من أين تبدأ ، فراجع ورقة OG حول النماذج العالمية من @hardmaru و @SchmidhuberAI
- من الواضح جدا قراءة الأساسيات والحصول عليها
- يمكنك إعادة إنتاجه على جهاز Mac الخاص بك أو أي جهاز محلي
- يمكنك ترقيته بشكل مطرد ليكون أكثر قوة
إذا كان كارباثي يعلم نماذج العالم ، فهذه هي الورقة التي سيتعمق فيها.
13.5K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز