Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

Theo như tôi biết, Suno đang ở trên biên Pareto của việc tổng hợp giọng nói, mặc dù nó được thiết kế cho âm nhạc hơn là cho lời nói. Ưu điểm: - khả năng tạo ra giọng nói tùy chỉnh được chỉ định trong văn bản: mô tả bất kỳ thuộc tính chất lượng nào về cách giọng nói nghe và cách lời nói được truyền đạt - xử lý cảm xúc tốt - ít phẳng và máy móc hơn so với những thứ khác mà tôi đã thử - hỗ trợ looming (nhánh và tiếp tục các mẫu được tạo từ các điểm tùy ý) Nhược điểm: - chậm - không có API - mất tính nhất quán qua các văn bản dài - có xu hướng chuyển sang hát hoặc chèn nhạc nền ngay cả khi bạn chỉ yêu cầu lời nói (mặc dù bạn có thể xuất các stem giọng để loại bỏ nhạc nền) Vì vậy, nó lý tưởng cho việc đọc to các văn bản ngắn, không tương tác, hoặc để tạo ra các giọng nói tùy chỉnh có thể được nhập vào ví dụ như Elevenlabs, trong cả hai trường hợp nếu bạn muốn có nhiều quyền kiểm soát hơn về âm thanh và tính cách của giọng nói. Nếu có một lựa chọn tốt hơn với nhiều ưu điểm hơn hoặc ít nhược điểm hơn, tôi rất muốn biết về nó.

Hàng đầu

Thứ hạng

Yêu thích