Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Memperkenalkan Eleven v3 (alpha) - model Text to Speech paling ekspresif yang pernah ada.
Mendukung 70+ bahasa, dialog multi-speaker, dan tag audio seperti [bersemangat], [menghela nafas], [tertawa], dan [berbisik].
Sekarang di alfa publik dan diskon 80% di bulan Juni.
Ini adalah pratinjau penelitian. Ini membutuhkan rekayasa yang lebih cepat daripada model sebelumnya - tetapi generasinya menakjubkan.
Kami akan terus menyempurnakan untuk meningkatkan keandalan dan kontrol.
Arsitektur baru Eleven v3 sangat memahami teks - memberikan ekspresi yang jauh lebih besar.
Dan sekarang Anda dapat memandu generasi secara lebih langsung menggunakan tag audio:
- Emosi [sedih] [marah] [bahagia]
- Arah pengiriman [berbisik] [berteriak]
- Reaksi non-verbal [tertawa] [berdeham] [menghela nafas]
Hasilkan dialog multi-speaker yang terdengar seperti percakapan nyata.
Eleven v3 menangani interupsi, pergeseran nada, dan isyarat emosional berdasarkan konteks percakapan.
API Publik untuk Eleven v3 (alpha) akan segera hadir. Untuk akses awal, silakan hubungi penjualan.
Kami sedang mengerjakan versi real-time v3. Untuk kasus penggunaan real-time dan percakapan, kami sarankan untuk tetap menggunakan v2.5 Turbo atau Flash untuk saat ini.
Dibuat untuk kreator dan pengembang yang membuat alat media.
Jika Anda mengerjakan video, buku audio, atau alat media - v3 membuka tingkat ekspresi baru. Pelajari cara memaksimalkannya dengan panduan panduan kami:
Eleven v3 (alpha) tersedia sekarang:
Ini diskon 80% selama bulan Juni.
Cobalah - dan bagikan generasi terbaik Anda dengan kami.
1,41M
Teratas
Peringkat
Favorit