المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
التعلم المعزز هو آلية قوية لتدريب نماذج الشركة الخاصة على أعمالهم وبياناتهم الفريدة. هذا ما نقوم به في Applied Compute. التحدي الرئيسي هو كيفية جعل التعلم المعزز فعالا، لأننا بحاجة لأن تكون الجولات سريعة (تتم في أيام)، ورخيصة (اقتصاديات وحدات قابلة للتوسع)، ومتوقعة (ليس فقط سريعة، بل سريعة بشكل موثوق). إليك بعض النقاط المستخلصة:
• التعلم المتزامن يضيع الوقت والحوسبة.
• التعلم المعزز غير المتزامن أكثر كفاءة لكنه يسبب الجمود، مما يسبب عدم استقرار التعلم.
• يمكن للنمذجة والمحاكاة أن تساعد تحليليا في حل أي تكوين يؤدي إلى كفاءة مثلى. هذا يسمح لنا بإنشاء نماذج أولية سريعة لتكوينات التدريب، دون استهلاك دورات حوسبة مكلفة أثناء التجارب التجريبية.
ناقش اثنان من مؤسسينا، @rhythmrg و@lindensli، بعض هذه الأبحاث مؤخرا في @aiDotEngineer، مع التركيز على المشكلة الفرعية التالية: ما هي أعلى طريقة لتنفيذ التعلم الواقعي مع وجود أقصى حالة من الجمود وميزانية الحوسبة؟
الأفضل
المُتصدِّرة
التطبيقات المفضلة

