المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
نحن نساعد الذكاء الاصطناعي على رؤية العالم ثلاثي الأبعاد متحركا كما يفعل البشر. 🌐
هنا يأتي دور D4RT: نموذج موحد يحول الفيديو إلى تمثيلات رباعية الأبعاد أسرع من الطرق السابقة - مما يمكنه من فهم المكان والزمان. هكذا تسير 🧵 الأمور
لكي يدرك المشهد ثنائي الأبعاد مصور بالفيديو، يجب على الذكاء الاصطناعي تتبع كل بكسل من كل جسم أثناء حركته. 🔍️️
يتطلب التقاط هذا المستوى من الهندسة والحركة عمليات حسابية مكثفة تؤدي إلى إعادة بناء بطيئة ومجزأة. لكن D4RT يتبع نهجا مختلفا.
يقوم D4RT بترميز فيديوهات الإدخال إلى نسخة مضغوطة، ثم يعالج البيانات ويستشير إليها باستخدام فك ترميز خفيف الوزن بالتوازي.
هذا يجعلها سريعة للغاية وقابلة للتوسع - سواء لتتبع بعض النقاط فقط، أو لإعادة بناء مشهد كامل. 🖼️
يمكن الآن حل العديد من المهام رباعية الأبعاد باستخدام نموذج واحد، مما يمكننا من:
👉 تنبأ بمسار البكسل ثلاثي الأبعاد من خلال البحث عن موقعه عبر خطوات زمنية مختلفة.
⏱️ تجميد الوقت وزاوية الكاميرا لتوليد هيكل ثلاثي الأبعاد كامل للمشهد.
يمكن ل D4RT حتى إنشاء ومحاذاة لقطات ثلاثية الأبعاد للحظة واحدة من وجهات نظر مختلفة - مما يعيد بسهولة مسار الكاميرا. 🎥
53
الأفضل
المُتصدِّرة
التطبيقات المفضلة
