Puheagenttien esittely: täysin uusi yritystason puheagenttikehys 🗣️👾 Äänitoiminnallisten agenttityönkulkujen rakentaminen on nyt helpottunut, nopeampi ja luotettavampi. Voice-Agents on täysin uusi, tuotantovalmis Python-kehys, joka tarjoaa saumattoman integraation useiden TTS/STT-palveluntarjoajien kanssa, reaaliaikaisen suoratoiston ja kaiken, mitä tarvitset keskustelevien agenttiavustajien rakentamiseen. > Monipalveluntarjoajatuki: OpenAI, ElevenLabs ja Groq > Reaaliaikainen suoratoisto matalaviiveisille agenttivuorovaikutuksille > Tuotantovalmis yritystason lokituksella, telemetrialla ja virheenkäsittelyllä Opi lisää ⬇️🧵
2 / Monipalveluntarjoajan TTS-tuki Vaihda palveluntarjoajan välillä vaivattomasti yhtenäisen API:n avulla. Tarvitsetpa sitten OpenAI:n luonnollisia ääniä, ElevenLabsin ilmaisukykyjä tai Groqin nopeaa päättelyä, Voice-Agents hoitaa kaiken johdonmukaisilla käyttöliittymillä. > 10+ OpenAI-ääntä (alloy, nova, shimmer ja muita) > 30+ ElevenLabs-ääntä edistyneellä ääniohjauksella > Unified stream_tts() -toiminto toimii kaikilla palveluntarjoajilla Esimerkkejä:
3 / Reaaliaikainen suoratoistoarkkitehtuuri Suunniteltu agenttipohjaisille järjestelmille, jotka tarvitsevat matalaviiveistä äänentoistoa. Voice-Agents käsittelee äänipätkiä niiden saapuessa, mahdollistaen luonnolliset keskustelut ilman kiusallisia taukoja tai viiveitä. > StreamingTTSCallback puhuu automaattisesti kokonaisia lauseita agentin tuloksista > Generaattoripohjainen suoratoisto FastAPI:lle ja verkkosovelluksille > Älykäs lauseiden tunnistus luonnollisille puhetauoille Github:
4 / Kehittyneet puheesta tekstiksi -toiminnot Korkean tarkkuuden transkriptio OpenAI Whisperin ja ElevenLabsin STT:n tukemana. Tukee useita syöttömuotoja, kaiuttimien päivämäärittelyä, aikaleimoja ja kielen tunnistusta kattavaan äänenkäsittelyyn. > Tiedostopohjainen ja reaaliaikainen äänitranskriptio > Kaiuttimien päivittäminen ja aikaleiman poimiminen > Tuki numpy-arrayille, äänitiedostoille ja suoratoistoäänille Esimerkkejä:
5 / Tuotantovalmis infrastruktuuri Yritystason ominaisuudet on rakennettu jokaiseen osaan. Yhteyspoolista ja HTTP/2-tuesta kattavaan virheenkäsittelyyn ja tyyppiturvallisuuteen Voice-Agents on suunniteltu skaalaamaan. > Optimoitu HTTP-asiakasohjelma, jossa on yhteyspoolaus ja keepalive > Täystyypin vihjeet ja kirjaimelliset tyypit parempaan IDE-tukeen > Sisäänrakennetut äänityökalut: tallennus, toisto, formaatin muuntaminen
6 / Käyttötapaukset: Kaupankäyntiagenteista ääniavustajiksi Voice-Agents tukee todellisia sovelluksia eri toimialoilla. Rakenna äänikäyttöisiä kaupankäyntijärjestelmiä, keskustelevia tekoälyavustajia, reaaliaikaisia transkriptiopalveluita ja multimodaalisia sovelluksia, joissa on rikkaita interaktiivisia kokemuksia. > Ääniohjatut kaupankäyntiagentit, joissa on reaaliaikainen markkinakerronta > Keskustelevat tekoälyavustajat, joissa on luonnollinen puheen synteesi > Kokousten transkriptio- ja haastattelujen käsittelyjärjestelmät
7 / Saumaton parvien integrointi Osa Swarms-ekosysteemiä, yritystason moniagenttien orkestrointikehystä. Voice-Agentit integroituvat suoraan Swarms-agentteihin, mahdollistaen puhetukevat moniagenttijärjestelmät suoraan paketista. > Toimii saumattomasti Swarms Agent -luokan kanssa > Reaaliaikaisten agenttien vastausten suoratoisto > Aloita: pip-asenna ääniagentit
37