DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Inworld TTS 1 Max adalah pemimpin baru di Papan Peringkat Arena Pidato Analisis Buatan, melampaui seri Speech-02 MiniMax dan seri TTS-1 OpenAI Arena Pidato Analisis Buatan memberi peringkat model Teks ke Ucapan terkemuka berdasarkan preferensi manusia. Di arena, pengguna membandingkan dua bagian ucapan yang dihasilkan secara berdampingan dan memilih output pilihan mereka tanpa mengetahui model mana yang membuatnya. Arena pidato mencakup petunjuk di empat kategori petunjuk dunia nyata: Layanan Pelanggan, Berbagi Pengetahuan, Asisten Digital, dan Hiburan. Inworld TTS 1 Max dan Inworld TTS 1 keduanya mendukung 12 bahasa termasuk Inggris, Spanyol, Prancis, Korea, dan Cina, dan kloning suara dari audio 2-15 detik. Inworld TTS 1 memproses rata-rata ~153 karakter per detik waktu pembangkitan, dengan model yang lebih besar, Inworld TTS 1 Max memproses rata-rata ~69 karakter. Kedua model juga mendukung tag suara, memungkinkan pengguna untuk menambahkan emosi, gaya penyampaian, dan suara non-verbal, seperti "berbisik", "batuk", dan "terkejut". Baik TTS-1 dan TTS-1-Max adalah model autoregresif berbasis transformator yang masing-masing menggunakan LLaMA-3.2-1B dan LLaMA-3.1-8B sebagai tulang punggung SpeechLM mereka. Lihat model terkemuka di Speech Arena, dan dengarkan contoh klip di bawah ini 🎧

Contoh prompt di Inworld TTS 1 Max: "Mikrobioma usus Anda mengandung triliunan bakteri yang memengaruhi pencernaan, kekebalan, dan bahkan kesehatan mental melalui sumbu usus-otak."

Inworld TTS 1 memproses rata-rata ~153 karakter per detik waktu pembangkitan, dengan Inworld TTS 1 Max memproses rata-rata ~69 karakter.

40,42K

Teratas

Peringkat

Favorit