Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Inworld TTS 1 Max er den nye lederen på Artificial Analysis Speech Arena Leaderboard, og overgår MiniMax sin Speech-02-serie og OpenAIs TTS-1-serie
Artificial Analysis Speech Arena rangerer ledende tekst-til-tale-modeller basert på menneskelige preferanser. På arenaen sammenligner brukere to deler av generert tale side om side og velger deres foretrukne utgang uten å vite hvilke modeller som skapte dem. Talearenaen inkluderer spørsmål på tvers av fire virkelige kategorier av spørsmål: Kundeservice, Kunnskapsdeling, Digitale assistenter og Underholdning.
Inworld TTS 1 Max og Inworld TTS 1 støtter begge 12 språk, inkludert engelsk, spansk, fransk, koreansk og kinesisk, og stemmekloning fra 2-15 sekunder med lyd. Inworld TTS 1 behandler ~153 tegn per sekund av generasjonstiden i gjennomsnitt, med den større modellen, Inworld TTS 1 Max, som behandler ~69 tegn i gjennomsnitt. Begge modellene støtter også stemmekoder, slik at brukere kan legge til følelser, leveringsstil og ikke-verbale lyder, for eksempel "hvisking", "hoste" og "overrasket".
Både TTS-1 og TTS-1-Max er transformatorbaserte, autoregressive modeller som bruker henholdsvis LLaMA-3.2-1B og LLaMA-3.1-8B som deres SpeechLM-ryggrad.
Se de ledende modellene i Speech Arena, og lytt til eksempelklipp nedenfor 🎧

Eksempelmelding på Inworld TTS 1 Max: "Tarmmikrobiomet ditt inneholder billioner av bakterier som påvirker fordøyelsen, immuniteten og til og med mental helse gjennom tarm-hjerne-aksen."
Inworld TTS 1 behandler ~153 tegn per sekund av generasjonstiden i gjennomsnitt, med Inworld TTS 1 Max som behandler ~69 tegn i gjennomsnitt.

40,4K
Topp
Rangering
Favoritter

