DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Soweit ich weiß, befindet sich Suno an der Pareto-Front der Sprachsynthese, auch wenn es für Musik und nicht für Sprache gedacht ist. Vorteile: - Fähigkeit, benutzerdefinierte Stimmen zu generieren, die im Text spezifiziert sind: beschreibe qualitative Eigenschaften darüber, wie die Stimme klingt und wie die Sprache geliefert wird - verarbeitet Emotionen gut - weniger flach und robotisch als andere Dinge, die ich ausprobiert habe - unterstützt Looming (Verzweigung und Fortsetzung generierter Samples von beliebigen Punkten) Nachteile: - langsam - keine API - verliert die Kohärenz bei langen Texten - hat die Tendenz, in Gesang auszubrechen oder Hintergrundinstrumente einzufügen, selbst wenn du nur nach Sprache fragst (obwohl du Gesangsstämme exportieren kannst, um die Instrumente loszuwerden) Es ist also ideal, um kurze, nicht-interaktive Texte laut vorzulesen oder um benutzerdefinierte Stimmen zu erstellen, die z.B. in Elevenlabs importiert werden können, in beiden Fällen, wenn du viel Kontrolle über den Klang und die Persönlichkeit der Stimme haben möchtest. Wenn es eine bessere Option mit mehr dieser Vorteile oder weniger dieser Nachteile gibt, würde ich gerne davon erfahren.

Top

Ranking

Favoriten