تقديم وكلاء الصوت: إطار عمل 🗣️👾 جديد كليا لوكلاء الصوت على مستوى المؤسسات بناء سير عمل وكيل مدعوم بالصوت أصبح أسهل وأسرع وأكثر موثوقية. Voice-Agents هو إطار عمل جديد كليا لبايثون جاهز للإنتاج، يوفر تكاملا سلسا مع عدة مزودي TTS/TT، والبث في الوقت الحقيقي، وكل ما تحتاجه لبناء مساعدين وكلاء محادثين. > دعم متعدد المزودين: OpenAI، ElevenLabs، وGroq > البث في الوقت الحقيقي لتفاعلات الوكلاء ذات الكمون المنخفض > جاهز للإنتاج مع تسجيل بيانات، وبيانات عن بعد، ومعالجة الأخطاء بمستوى مؤسسي التعرف على المزيد ⬇️🧵
2 / دعم TTS متعدد المزودين انتقل بين المزودين بسهولة باستخدام واجهة برمجة تطبيقات موحدة. سواء كنت بحاجة إلى الأصوات الطبيعية في OpenAI، أو خيارات التعبيرات في ElevenLabs، أو الاستدلال السريع من Groq، فإن Voice-Agents يتعامل مع كل ذلك بواجهات متسقة. > 10+ أصوات OpenAI (سبيك، نوفا، شيمر، والمزيد) > 30+ أصوات ElevenLabs مع تحكم صوتي متقدم > تعمل وظيفة stream_tts() الموحدة عبر جميع المزودين أمثلة:
3 / بنية البث في الوقت الحقيقي تم تصميمها للأنظمة القائمة على الوكلاء التي تحتاج إلى بث صوتي منخفض التأخير. يقوم وكلاء الصوت بمعالجة مقاطع الصوت عند وصولها، مما يتيح إجراء محادثات طبيعية دون توقفات أو تأخيرات محرجة. > StreamingTTSCallback ينطق تلقائيا بجمل كاملة من مخرجات الوكلاء > البث القائم على المولد لتطبيقات FastAPI والويب > الكشف الذكي عن الجمل لفترات التوقف الطبيعية في الكلام Github:
4 / قدرات تحويل الكلام إلى نص المتقدمة النسخ عالي الدقة مدعوم ب OpenAI Whisper وElevenLabs STT. يدعم عدة صيغ إدخال، وتوثيق مكبرات الصوت، والطابع الزمني، واكتشاف اللغة لمعالجة صوتية شاملة. > النسخ الصوتي المعتمد على الملفات وفي الوقت الحقيقي > توثيق مكبر الصوت واستخراج الطوابع الزمنية > دعم المصفوفات العددية، وملفات الصوت، والصوت المتدفق. أمثلة:
5 / البنية التحتية الجاهزة للإنتاج ميزات من مستوى المؤسسات مدمجة في كل مكون. من تجميع الاتصالات ودعم HTTP/2 إلى التعامل الشامل مع الأخطاء وسلامة الأنواع، تم تصميم Voice-Agents ليكون واسع النطاق. > عميل HTTP محسن مع تجميع الاتصالات والحفاظ على الحياة > تلميحات النوع الكامل وأنواع الحرفية لدعم أفضل لبيئة تطوير التطوير > أدوات الصوت المدمجة: التسجيل، التشغيل، تحويل الصيغة
6 / حالات الاستخدام: من وكلاء التداول إلى المساعدين الصوتيين تدعم وكلاء الصوت التطبيقات الواقعية عبر الصناعات. ابن أنظمة تداول مدعومة بالصوت، ومساعدين الذكاء الاصطناعي المحادثين، وخدمات النسخ في الوقت الحقيقي، وتطبيقات متعددة الوسائط بتجارب تفاعلية غنية. > وكلاء تداول مدعومون بالصوت مع سرد سوق في الوقت الحقيقي > مساعدي الذكاء الاصطناعي المحادثة مع تخليق الكلام الطبيعي > أنظمة النسخ والمقابلات في الاجتماعات
7 / دمج الأسراب السلسة جزء من منظومة Swarms، إطار التنسيق متعدد الوكلاء على مستوى المؤسسات. يتكامل Voice-Agents مباشرة مع عملاء Swarms، مما يتيح أنظمة متعددة الوكلاء الصوتية جاهزة من اللعبة. > يعمل بسلاسة مع فئة عملاء الأسراب > المكالمات المتدفقة للاستجابات الفورية للوكلاء > ابدأ: تثبيت وكلاء الصوت في pip
‏‎39‏