今年はリアルタイム音声の年です!@Cartesiaチーム、おめでとうございます。彼らの建築の創造性、パフォーマンスへの執着、そして好みは、最終的にAIの会話を人間らしく感じさせます(200ミリ秒未満の遅延、多言語の一貫性、自然な感情の範囲)。