Hầu hết các đội thu thập dữ liệu giọng nói tối ưu hóa cho khối lượng hơn là chất lượng, một phần vì họ đang đo lường chất lượng sai cách. Để giúp đánh giá chất lượng, chúng tôi đã tạo ra Điểm Poseidon. Khi áp dụng, âm thanh của một người nói có điểm số tốt trong khi các cuộc hội thoại nhiều người nói có điểm số kém hơn. Tại sao? ↓