Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Snakk med porteføljen din.
Vi har nettopp sendt stemmen til Muntze: to moduser, samme inputbar.
Diktering: tap-mikrofon, snakk, ord vises i tekstfeltet. Redigering før sending. Svaret kommer tilbake som tekst.
Samtale: tapp bølgeform, snakk naturlig. Muntze lytter, tenker, og snakker så tilbake til deg mens tekstmeldingen er
strømmer samtidig.
Den tekniske delen som betyr noe: vi bruker ikke en native lydmodell. Vi bygde en pipeline med dobbel strømming:
talen din går via Web Speech API, vår LLM behandler den, og Sonic syntetiserer svarsetningen-
etter setning når tokens ankommer. Første lyd spilles på under 400 ms etter at den første setningen er dannet.
De vanskelige problemene vi løste:
→ Ekkokansellering: STT pauser under avspilling slik at Muntze ikke transkriberer sin egen stemme og looper for alltid
→ Setningsrekkefølge: TTS ber om ild parallelt for hastighet, men lyden spilles i streng rekkefølge
→ Kort stemme: når du lytter, vil du ikke ha et 2-minutters essay. Agenten bytter automatisk til
2-3 setningers samtalesvar i stemmemodus.
Samme dybde er tilgjengelig hvis du spør om oppfølginger.
To ikoner. Ett trykk. Spør Muntze hvordan porteføljen din går, og hør faktisk svaret mens du tjener
Kaffe.
Topp
Rangering
Favoritter
