المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
سلسلة GLM-4.6V هنا🚀
- GLM-4.6V (106B): نموذج لغة رؤية رائد بسياق 128K
- GLM-4.6V-Flash (9B): إصدار فائق السرعة وخفيفة الوزن لأحمال العمل المحلية ومنخفضة التأخير
أول استدعاء دالة أصلي في عائلة نماذج رؤية GLM
اثقال:
جرب GLM-4.6V الآن:
واجهة برمجة التطبيقات (API):
مدونة التقنية:
تسعير API (لكل مليون توكن):
- GLM-4.6V: $0.6 مدخل / $0.9 خرج
- GLM-4.6V-فلاش: مجاني

يمكن ل GLM-4.6V قبول مدخلات متعددة الوسائط من أنواع مختلفة وتوليد محتوى متداخل عالي الجودة ومنظم مع صور ونص متداخلة.
يقدم GLM-4.6V سير عمل متعدد الوسائط من البداية إلى النهاية، مما يمكن النموذج من الانتقال بسلاسة من الإدراك البصري إلى الاسترجاع عبر الإنترنت، إلى التفكير، ثم إلى الإجابة النهائية.
قمنا بتحسين GLM-4.6V لتطوير الواجهة الأمامية، مما قلص بشكل كبير دورة "التصميم إلى البرمجة".
يقوم GLM-4.6V بمحاذاة المشفر البصري بطول سياق يبلغ 128 كيلوبايت، مما يمنح النموذج سعة ذاكرة ضخمة. في الواقع، هذا يعني معالجة ~150 صفحة من المستندات المعقدة، أو 200 صفحة شرائح، أو فيديو مدته ساعة واحدة في تمريرة استنتاج واحدة.
يمكن للنموذج إجراء تلخيص شامل على مقاطع الفيديو الطويلة مع الاحتفاظ بالقدرة على إجراء استدلال دقيق حول الأدلة الزمنية، مثل تلخيص أحداث الأهداف والطوابع الزمنية في مباراة كرة قدم كاملة.
177.55K
الأفضل
المُتصدِّرة
التطبيقات المفضلة

