Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nejlepší a nejrychlejší model převodu řeči na text na světě je nyní ještě lepší!
Právě @AssemblyAI vypustil obrovskou aktualizaci a já jsem naprosto zamilovaný do jedné z nových funkcí.
1. Za prvé, nyní mohou automaticky identifikovat osobu hovořící ve zvuku podle jména nebo role.
2. Můžete také požádat o přepis v jakémkoli jazyce (dosud podporováno 99 jazyků), takže se nemusíte starat o provádění dalších kroků pro překlad.
Ale moje zdaleka nejoblíbenější funkce je LLM Gateway, která vám umožní konsolidovat celý váš hlasový stack do jediné platformy.
Brána je rozhraní API, které můžete použít pro širokou škálu úloh souvisejících se zvukem. Můžete jej například použít ke shrnutí hovoru, extrahování přehledů nebo klasifikaci mínění řečníka.
Už není potřeba vícestupňový řetězec. Můžete uskutečnit jeden hovor a platforma přesměruje požadavek na příslušný model, včetně OpenAI, Gemini a dalších.
To je obrovské pro každého, kdo používá hlas v produkčních aplikacích!
To vše běží na jejich již tak šíleně rychlé a přesné platformě pro převod řeči na text, s diarizací a vícejazyčným školením.
Pokud stavíte pomocí hlasu, je to převratná změna.
Jsem uživatelem Assembly AI již několik let. Jejich modely a API jsou úžasné a jsem rád, že se rozhodli se mnou na tomto příspěvku spolupracovat.
Jejich model si můžete vyzkoušet na jejich hřišti kliknutím zde:
Top
Hodnocení
Oblíbené

