Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Bicaralah dengan portofolio Anda.
Kami baru saja mengirimkan suara ke Muntze: dua mode, bilah input yang sama.
Dikte: ketuk mikrofon, bicarakan, kata-kata muncul di bidang teks. Edit sebelum mengirim. Respons kembali sebagai teks.
Percakapan: ketuk bentuk gelombang, bicaralah secara alami. Muntze mendengarkan, berpikir, lalu berbicara kembali kepada Anda saat teks
streaming secara bersamaan.
Bagian teknis yang penting: kami tidak menggunakan model audio asli. Kami membangun pipeline dual-streaming:
ucapan Anda mencapai Web Speech API, LLM kami memprosesnya, dan Sonic mensintesis kalimat respons-
dengan kalimat saat token tiba. Audio pertama diputar dalam waktu kurang dari 400ms setelah kalimat pertama terbentuk.
Masalah sulit yang kami pecahkan:
→ Pembatalan Echo: STT berhenti selama pemutaran sehingga Muntze tidak menyalin suaranya sendiri dan mengulang selamanya
→ Urutan kalimat: TTS meminta tembak secara paralel untuk kecepatan, tetapi audio diputar dalam urutan yang ketat
→ Singkatnya suara: saat Anda mendengarkan, Anda tidak menginginkan esai 2 menit. Agen secara otomatis beralih ke
Respons percakapan 2-3 kalimat dalam mode suara.
Kedalaman yang sama tersedia jika Anda meminta tindak lanjut.
Dua ikon. Satu ketukan. Tanyakan kepada Muntze bagaimana kinerja portofolio Anda dan benar-benar dengarkan jawabannya saat Anda membuat
kopi.
Teratas
Peringkat
Favorit
