這是即時語音的年份!恭喜 @Cartesia 團隊。他們的建築創意、對性能的執著以及品味,終於讓 AI 對話感覺像人類(低於 200 毫秒的延遲、多語言一致性和自然的情感範圍)。