نقدم لكم Voxtral Transcribe 2، نماذج تحويل الكلام إلى نص من الجيل التالي من @MistralAI. نسخ متطورة، توثيق مكبرات الصوت، زمن تأخير في الوقت الحقيقي أقل من 200 مللي ثانية. تفاصيل في 🧵
تم تصميم Voxtral Realtime لأجهزة الصوت والتطبيقات الحية. توفر معمارية البث الأصلية لها زمن استجابة قابل للتكوين لأقل من 200 مللي ثانية. وعند 480 مللي ثانية، يبقى ضمن 1-2٪ من WER من نموذجنا غير المتصل. نطلق النموذج كأوزان مفتوحة تحت نظام Apache 2.0.
ابدأ بتجربة Voxtral Mini Transcribe 2 في ساحة الصوت الجديدة على Mistral Studio. رفع ملفات، وفعل التوثيق، وأضف تحيز السياق، واحصل على نسخ فورية.
متوفر الآن. Mini Transcribe 2 عبر واجهة برمجة التطبيقات بسعر 0.003 دولار/دقيقة. الوقت الحقيقي عبر واجهة برمجة التطبيقات بسعر 0.006 دولار في الدقيقة، بالإضافة إلى الأوزان المفتوحة. ابدأ →
‏‎48‏