الإعلان عن DreamDojo: نموذج العالم التفاعلي مفتوح المصدر الذي يأخذ تحكم محرك الروبوت ويولد المستقبل بالبكسل. لا محرك، لا شبكات، لا ديناميكيات مكتوبة يدويا. إنها المحاكاة 2.0. حان الوقت للروبوتات لتأخذ حبة الدرس المر. تعلم الروبوتات في العالم الحقيقي يعاني من عنق زجاجة بسبب الزمن، والاستهلاك، والأمان، وإعادة الضبط. إذا أردنا أن يتحرك الذكاء الاصطناعي الفيزيائي بسرعة ما قبل التدريب، نحتاج إلى محاكي يتكيف مع نطاق التدريب المسبق بأقل قدر ممكن من الهندسة البشرية. رؤانا الرئيسية: (1) الفيديوهات الأنانية البشرية مصدر قابل للتوسع لفيزياء منظور الشخص الأول؛ (2) تجعلها الأفعال الكامنة "قابلة للقراءة بواسطة الروبوتات" عبر أجهزة مختلفة؛ (3) الاستدلال في الوقت الحقيقي يفتح تخطيط الفحص المباشر عن بعد، وتقييم السياسات، وتخطيط وقت الاختبار *داخل* الحلم. نحن نتدرب مسبقا على 44 ألف ساعة من الفيديوهات البشرية: رخيصة، وفيرة، ومجمعة بدون أي روبوت في الحلقة. لقد استكشف البشر بالفعل التركيبات: نحن نمسك، نصب، نطي، نجمع، نفشل، نعيد المحاولة — عبر مشاهد مزدحمة، وجهات نظر متغيرة، وضوء متغير، وسلاسل مهام تستمر لساعة—على نطاق لا يمكن لأي أسطول روبوتات أن يضاهيه. القطعة المفقودة: هذه الفيديوهات لا تحمل أي تسميات أكشن. لذا نقدم إجراءات كامنة: تمثيل موحد مستنتاج مباشرة من الفيديوهات يلتقط "ما تغير بين دول العالم" دون معرفة الأجهزة الأساسية. هذا يسمح لنا بالتدريب على أي فيديو من منظور الشخص الأول كما لو كان مرفقا بأوامر محركية. نتيجة لذلك، تعمم دريم دوجو الطلقة الصفرية على الأشياء والبيئات التي لم تر في أي مجموعة تدريب روبوتات، لأن البشر هم من رأوها أولا. بعد ذلك، نقوم بالتدريب اللاحق على كل روبوت ليتناسب مع أجهزته الخاصة. فكر في الأمر كفصل بين "كيف يبدو العالم ويتصرف" عن "كيف يعمل هذا الروبوت بالذات". النموذج الأساسي يتبع القواعد الفيزيائية العامة، ثم "ينتقلم" إلى آليات الروبوت الفريدة. يشبه الأمر تحميل شخصية جديدة وأصول مشهد في Unreal Engine، لكن يتم عبر تدرج تدرج ويعمم بكثير إلى ما بعد مجموعة البيانات بعد التدريب. محاكي العالم مفيد فقط إذا كان يعمل بسرعة كافية لإغلاق الحلقة. نقوم بتدريب نسخة فورية من DreamDojo تعمل بسرعة 10 إطارات في الثانية، وتستقر لأكثر من دقيقة من النشر المستمر. هذا يفتح إمكانيات مثيرة: - تشغيل مباشر عن بعد *داخل* حلم. قم بتوصيل وحدة تحكم VR، وبث الإجراءات إلى DreamDojo، وإرسال روبوت افتراضي في الوقت الحقيقي. نعرض هذا على Unitree G1 مع سماعة رأس PICO وبطاقة RTX 5090 واحدة. - تقييم السياسات. يمكنك اختبار نقطة تفتيش للسياسة في DreamDojo بدلا من العالم الحقيقي. معدلات النجاح المحاكاة ترتبط ارتباطا وثيقا بنتائج العالم الحقيقي - دقيقة بما يكفي لترتيب نقاط التفتيش دون حرق أي محرك. - التخطيط القائم على النماذج. قم بتجربة مقترحات عمل متعددة → محاكاتها جميعا بالتوازي → اختيار أفضل مستقبل. تحقق نجاحا حقيقيا بنسبة +17٪ من البداية في مهمة تعبئة الفواكه. نحن نفتح المصدر كل شيء!! الأوزان، الكود، مجموعة البيانات بعد التدريب، مجموعة التقييم، والورقة البيضاء التي تحتوي على الكثير من التفاصيل التي يجب إعادة إنتاجها. DreamDojo مبني على NVIDIA Cosmos، الذي هو أيضا مفتوح الوزن. عام 2026 هو عام نماذج العالم للذكاء الاصطناعي المادي. نريدكم أن تبنوا معنا. أتمنى لك توسعا سعيدا! روابط في الموضوع: