Artık üretim seviyesindeki metin-konuşma uygulamasını 200ms'in altında gecikmeyle çalıştırabilirsiniz. Açık kaynaklı bir TTS sistemi ise 150ms ses çıkışıyla gerçek zamanlı yayın sunuyordu. Dokuz dil ve birçok lehçede sıfır atış ses klonlamasını destekler. Bi-streaming gerçek zamanlı sesi mümkün kılan Metni içeri atarken ses dışarı çıkıyor. Tam cümle tamponlaması yok. Gecikme düşük kalıyor ama ses kalitesi bozulmaz. Bu, canlı ajanlar, asistanlar ve etkileşimli uygulamalara uyuyor. • Metin girişi ve ses çıkışı eşzamanlı olarak çalışıyor • Uçtan uca gecikme ~150ms'ye ulaşır • Standart GPU çıkarım yığınlarıyla çalışır Sıfır atışlı ses klonlama diller arasında çalışır Konuşmacı özel eğitim olmadan sesleri klonlar. Bir kısa referans ses yeterli. Aynı ses diller ve aksanlar arasında aktarılır. • Dokuz ana dil destekleniyor • Dillerarası sentez tutarlı kalır. • Konuşmacı benzerliği sabit kalır Üretim için ince kontrol ekliyor Telaffuzu, hızı, duyguyu ve ses seviyesini kontrol edebilirsiniz. Sayılar ve semboller otomatik olarak normalleşiyor. Hizmet olarak veya konteynerlerin içinde çalışıyor. ...