DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Model ucapan-ke-teks terbaik dan tercepat di dunia menjadi lebih baik! @AssemblyAI baru saja merilis pembaruan besar, dan saya benar-benar jatuh cinta dengan salah satu fitur baru. 1. Pertama, mereka sekarang dapat secara otomatis mengidentifikasi orang yang berbicara dalam audio berdasarkan nama atau peran. 2. Anda juga dapat meminta transkrip dalam bahasa apa pun (99 bahasa didukung sejauh ini), jadi Anda tidak perlu khawatir menjalankan langkah tambahan untuk terjemahan. Tapi fitur favorit saya, sejauh ini, adalah LLM Gateway, yang memungkinkan Anda mengkonsolidasikan seluruh tumpukan suara Anda ke dalam satu platform. Gateway adalah API yang dapat Anda gunakan untuk berbagai tugas terkait audio. Misalnya, Anda dapat menggunakannya untuk meringkas panggilan, mengekstrak wawasan, atau mengklasifikasikan sentimen pembicara. Tidak perlu pipeline multi-langkah lagi. Anda dapat melakukan satu panggilan, dan platform akan merutekan permintaan ke model yang sesuai, termasuk OpenAI, Gemini, dan lainnya. Ini sangat besar bagi siapa saja yang menggunakan suara dalam aplikasi produksi! Semua ini berjalan di platform ucapan-ke-teks mereka yang sudah sangat cepat dan akurat, dengan diarisasi dan pelatihan multibahasa yang dipanggang. Jika Anda membangun dengan suara, ini adalah pengubah permainan. Saya telah menjadi pengguna Assembly AI selama bertahun-tahun. Model dan API mereka luar biasa, dan saya senang mereka memutuskan untuk berkolaborasi dengan saya dalam posting ini. Anda dapat mencoba model mereka di taman bermain mereka dengan mengklik di sini:

Teratas

Peringkat

Favorit