DApp Store | Web3 Hub for hendelser og spill

Populære emner

Inworld TTS 1 Max er den nye lederen på Artificial Analysis Speech Arena Leaderboard, og overgår MiniMax sin Speech-02-serie og OpenAIs TTS-1-serie Artificial Analysis Speech Arena rangerer ledende tekst-til-tale-modeller basert på menneskelige preferanser. På arenaen sammenligner brukere to deler av generert tale side om side og velger deres foretrukne utgang uten å vite hvilke modeller som skapte dem. Talearenaen inkluderer spørsmål på tvers av fire virkelige kategorier av spørsmål: Kundeservice, Kunnskapsdeling, Digitale assistenter og Underholdning. Inworld TTS 1 Max og Inworld TTS 1 støtter begge 12 språk, inkludert engelsk, spansk, fransk, koreansk og kinesisk, og stemmekloning fra 2-15 sekunder med lyd. Inworld TTS 1 behandler ~153 tegn per sekund av generasjonstiden i gjennomsnitt, med den større modellen, Inworld TTS 1 Max, som behandler ~69 tegn i gjennomsnitt. Begge modellene støtter også stemmekoder, slik at brukere kan legge til følelser, leveringsstil og ikke-verbale lyder, for eksempel "hvisking", "hoste" og "overrasket". Både TTS-1 og TTS-1-Max er transformatorbaserte, autoregressive modeller som bruker henholdsvis LLaMA-3.2-1B og LLaMA-3.1-8B som deres SpeechLM-ryggrad. Se de ledende modellene i Speech Arena, og lytt til eksempelklipp nedenfor 🎧

Eksempelmelding på Inworld TTS 1 Max: "Tarmmikrobiomet ditt inneholder billioner av bakterier som påvirker fordøyelsen, immuniteten og til og med mental helse gjennom tarm-hjerne-aksen."

Inworld TTS 1 behandler ~153 tegn per sekund av generasjonstiden i gjennomsnitt, med Inworld TTS 1 Max som behandler ~69 tegn i gjennomsnitt.

40,4K

Topp

Rangering

Favoritter