ذهبت إلى مختبر @DvijKalaria @berkeley_ai ولعبت تنس الطاولة ضد روبوته، أوريو. كنت ألعب الكثير من تنس الطاولة عندما كنت طفلا. كان هذا شعورا سرياليا مناسبا وأحد تلك اللحظات التي تقول "أتمنى لو أستطيع أن أخبر نفسي في المدرسة الثانوية". تنس الطاولة هو من أصعب الرياضات التي يمارسها الروبوتات. يمكن للكرة أن تتحرك بسرعة تصل إلى 30+ ميل في الساعة مع دوران ثقيل، ونية الخصم البشري مخفية، ويجب على الجسم كله أن ينسق. أوريو هو كائن بشري كامل يحمل مجدافا حقيقيا، وتعلم الحركات الأساسية مثل التأرجح من خلال مشاهدة دفيج وهو يعرض العرض. لا توجد بيانات تدريب جمعها الروبوتات. شخص واحد يعرض الاقتراح، والسياسة تعمم. الطريقة التي يعمل، كما فهمتها: - النظام الذكي (مخطط هرمي) يحدد أولا مكان الكرة ويختار أفضل نوع من الضربة، مثل ضربة أمامية أو خلفية. - تساعد هذه الخطة بعد ذلك في تدريب "دماغ" الروبوت (سياسة التعلم الواقعي) في محاكاة افتراضية. يتعلم الدماغ بالتجربة والخطأ، ويحصل على مكافآت عندما يقلد بعض الحركات النموذجية - بمجرد التدريب على المحاكاة، يتم تطبيق الإعداد بالكامل على الروبوت الفعلي ليتمكن من اللعب بشكل حقيقي. العروض البشرية هي في الأساس الحركات المرجعية. هم يبنون روبوتا شاهد تنس طاولة بشري أكثر من أي إنسان، ويستخدم ذلك لتطوير لعبته الخاصة. ومع ذلك فزت. (بالكاد. لكن هذا لن يدوم)
تابع أعمال دفيج هنا: وشكرا @hananyss على السماح لي بالانضمام إليك!
‏‎312‏