Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
¡El mejor y más rápido modelo de voz a texto del mundo ahora es aún mejor!
@AssemblyAI lanzado una gran actualización y estoy absolutamente enamorado de una de las nuevas características.
1. Primero, ahora pueden identificar automáticamente a la persona que habla en un audio por nombre o función.
2. También puede solicitar una transcripción en cualquier idioma (99 idiomas admitidos hasta ahora), por lo que no tiene que preocuparse por ejecutar pasos adicionales para la traducción.
Pero mi característica favorita, con mucho, es LLM Gateway, que le permite consolidar toda su pila de voz en una sola plataforma.
La puerta de enlace es una API que puede usar para una amplia gama de tareas relacionadas con el audio. Por ejemplo, puede usarlo para resumir una llamada, extraer información o clasificar el sentimiento del orador.
Ya no es necesario un pipeline de varios pasos. Puede realizar una sola llamada y la plataforma enrutará la solicitud al modelo apropiado, incluidos OpenAI, Gemini y otros.
¡Esto es enorme para cualquiera que use voz en aplicaciones de producción!
Todo esto se ejecuta en su plataforma de voz a texto, ya increíblemente rápida y precisa, con diarización y capacitación multilingüe incorporada.
Si está construyendo con voz, esto cambia las reglas del juego.
He sido usuario de Assembly AI durante años. Sus modelos y API son increíbles, y me alegro de que hayan decidido colaborar conmigo en esta publicación.
Puedes probar su modelo en su patio de recreo haciendo clic aquí:
Populares
Ranking
Favoritas

