Listopad v ElevenLabs: plynulejší, chytřejší agenti s naším novým modelem převodu řeči na text, vlna nových integrací, automatizací, self-hosted LLM a SIP + naše Creative Platform přecházející plně multimodálně. Tady je, co bylo odesláno. 🧵
Platforma Agents - Agents + Eleven Scribe v2 Realtime - Vydali jsme nový model převodu řeči na text, Eleven Scribe v2, plně optimalizovaný pro interaktivní případy použití v naší platformě Agents. Kromě toho, že vede v přesnosti a latenci, je připraven pro podnik v oblasti bezpečnosti a souladu – nyní můžete Scribe v2 povolit přímo v Agentech v pokročilém konfiguračním panelu - Samohostované LLM – Zavedli jsme self-hosted LLM na platformě Agents, což týmům přineslo nižší latenci, nižší náklady na uvažování a vyšší spolehlivost. GLM 4.5 Air a Qwen3-30B-A3B běží paralelně s naším TTS, STT a stackem pro střídání v jednom prostředí, což snižuje režii napříč systémy a zlepšuje výkon hlasových agentů - SIP - Vylepšili jsme integraci SIP, což usnadňuje nasazení SIP ve velkém měřítku. Agenty můžete připojit přímo k Twilio, Telnyx, Exotel, PBX nebo self-hosted SIP serverům, s šifrovanými hovory, statickými IP adresami pro soulad a bezproblémovým předáním lidským operátorům - Post-hovorová automatizace & MCP – přidali jsme post-hovorové webhooky pro n8n, což usnadňuje přechod z konverzace do workflow napříč CRM, ticketováním nebo interními systémy. Podpora MCP nyní propojuje agenty s vzdálenými servery pro úkoly jako správa cartridge v Shopify, vydávání refundací nebo dotazování dat v Supabase - Místní inženýři nasazení vpředu – výrazně jsme rozšířili náš tým FDE mezinárodně, aby pracoval lokálně ve všech geografických oblastech s našimi partnery na vytváření správných integrací a spolupráci na zakázkových modelech Kreativní platforma - Spustili jsme Iconic Marketplace – kurátorskou, vyčištěnou knihovnu legendárních hlasů. Sir Michael Caine se připojuje k zahájení spolu s více než 25 dalšími ikonami, čímž tvůrcům a studiím poskytuje bezpečný způsob, jak oživit nové příběhy - Image & Video – rozšířili jsme náš multimodální stack, který umožňuje přinést stávající značkové prvky nebo vytvořit nové s předními vizuálními modely vedle našich vlastních audio modelů - Zavedli jsme šablony – existující pracovní postupy kombinující modely, aby vám pomohli vytvářet rychleji bez pokusů a omylů, navazující na práci komunity - ElevenLabs Mobile – nyní můžete přistupovat k většímu množství Creative Platform přímo přes naši mobilní aplikaci Výzkum - Spustili jsme Scribe v2 Realtime – náš nejpřesnější model STT s nízkou latencí – dostupný přes API a napříč produkty. Poskytuje přibližně 150 ms transkripce napříč 90+ jazyky, zvládá šumové podmínky a obtížné identifikátory - Díky tomu nyní obsluhujeme řadu předních modelů zvuku v reálném čase a asynchronizaci: TTS, STT, orchestraci agentů, AI dabing, SFX a hudbu
5,6K