Bicaralah dengan portofolio Anda. Kami baru saja mengirimkan suara ke Muntze: dua mode, bilah input yang sama. Dikte: ketuk mikrofon, bicarakan, kata-kata muncul di bidang teks. Edit sebelum mengirim. Respons kembali sebagai teks. Percakapan: ketuk bentuk gelombang, bicaralah secara alami. Muntze mendengarkan, berpikir, lalu berbicara kembali kepada Anda saat teks streaming secara bersamaan. Bagian teknis yang penting: kami tidak menggunakan model audio asli. Kami membangun pipeline dual-streaming: ucapan Anda mencapai Web Speech API, LLM kami memprosesnya, dan Sonic mensintesis kalimat respons- dengan kalimat saat token tiba. Audio pertama diputar dalam waktu kurang dari 400ms setelah kalimat pertama terbentuk. Masalah sulit yang kami pecahkan: → Pembatalan Echo: STT berhenti selama pemutaran sehingga Muntze tidak menyalin suaranya sendiri dan mengulang selamanya → Urutan kalimat: TTS meminta tembak secara paralel untuk kecepatan, tetapi audio diputar dalam urutan yang ketat → Singkatnya suara: saat Anda mendengarkan, Anda tidak menginginkan esai 2 menit. Agen secara otomatis beralih ke Respons percakapan 2-3 kalimat dalam mode suara. Kedalaman yang sama tersedia jika Anda meminta tindak lanjut. Dua ikon. Satu ketukan. Tanyakan kepada Muntze bagaimana kinerja portofolio Anda dan benar-benar dengarkan jawabannya saat Anda membuat kopi.