DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Il miglior e più veloce modello di riconoscimento vocale al mondo è appena diventato ancora migliore! @AssemblyAI ha appena rilasciato un enorme aggiornamento, e sono assolutamente innamorato di una delle nuove funzionalità. 1. Prima di tutto, ora possono identificare automaticamente la persona che parla in un audio per nome o ruolo. 2. Puoi anche richiedere una trascrizione in qualsiasi lingua (99 lingue supportate finora), quindi non devi preoccuparti di eseguire ulteriori passaggi per la traduzione. Ma la mia funzionalità preferita, di gran lunga, è il LLM Gateway, che ti consente di consolidare l'intero stack vocale in un'unica piattaforma. Il gateway è un'API che puoi utilizzare per una vasta gamma di attività legate all'audio. Ad esempio, potresti usarlo per riassumere una chiamata, estrarre informazioni o classificare il sentimento del relatore. Non c'è più bisogno di una pipeline a più passaggi. Puoi effettuare una singola chiamata, e la piattaforma instraderà la richiesta al modello appropriato, inclusi OpenAI, Gemini e altri. Questo è enorme per chiunque utilizzi la voce in applicazioni di produzione! Tutto questo funziona sulla loro già incredibilmente veloce e precisa piattaforma di riconoscimento vocale, con diarizzazione e formazione multilingue integrate. Se stai costruendo con la voce, questo è un cambiamento radicale. Sono un utente di Assembly AI da anni. I loro modelli e API sono fantastici, e sono felice che abbiano deciso di collaborare con me per questo post. Puoi provare il loro modello nel loro playground cliccando qui:

Principali

Ranking

Preferiti