DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Memperkenalkan Eleven v3 (alpha) - model Text to Speech paling ekspresif yang pernah ada. Mendukung 70+ bahasa, dialog multi-speaker, dan tag audio seperti [bersemangat], [menghela nafas], [tertawa], dan [berbisik]. Sekarang di alfa publik dan diskon 80% di bulan Juni.

Ini adalah pratinjau penelitian. Ini membutuhkan rekayasa yang lebih cepat daripada model sebelumnya - tetapi generasinya menakjubkan. Kami akan terus menyempurnakan untuk meningkatkan keandalan dan kontrol.

Arsitektur baru Eleven v3 sangat memahami teks - memberikan ekspresi yang jauh lebih besar. Dan sekarang Anda dapat memandu generasi secara lebih langsung menggunakan tag audio: - Emosi [sedih] [marah] [bahagia] - Arah pengiriman [berbisik] [berteriak] - Reaksi non-verbal [tertawa] [berdeham] [menghela nafas]

Hasilkan dialog multi-speaker yang terdengar seperti percakapan nyata. Eleven v3 menangani interupsi, pergeseran nada, dan isyarat emosional berdasarkan konteks percakapan.

API Publik untuk Eleven v3 (alpha) akan segera hadir. Untuk akses awal, silakan hubungi penjualan. Kami sedang mengerjakan versi real-time v3. Untuk kasus penggunaan real-time dan percakapan, kami sarankan untuk tetap menggunakan v2.5 Turbo atau Flash untuk saat ini.

Dibuat untuk kreator dan pengembang yang membuat alat media. Jika Anda mengerjakan video, buku audio, atau alat media - v3 membuka tingkat ekspresi baru. Pelajari cara memaksimalkannya dengan panduan panduan kami:

Eleven v3 (alpha) tersedia sekarang: Ini diskon 80% selama bulan Juni. Cobalah - dan bagikan generasi terbaik Anda dengan kami.

1,91M

Teratas

Peringkat

Favorit