Snakk med porteføljen din. Vi har nettopp sendt stemmen til Muntze: to moduser, samme inputbar. Diktering: tap-mikrofon, snakk, ord vises i tekstfeltet. Redigering før sending. Svaret kommer tilbake som tekst. Samtale: tapp bølgeform, snakk naturlig. Muntze lytter, tenker, og snakker så tilbake til deg mens tekstmeldingen er strømmer samtidig. Den tekniske delen som betyr noe: vi bruker ikke en native lydmodell. Vi bygde en pipeline med dobbel strømming: talen din går via Web Speech API, vår LLM behandler den, og Sonic syntetiserer svarsetningen- etter setning når tokens ankommer. Første lyd spilles på under 400 ms etter at den første setningen er dannet. De vanskelige problemene vi løste: → Ekkokansellering: STT pauser under avspilling slik at Muntze ikke transkriberer sin egen stemme og looper for alltid → Setningsrekkefølge: TTS ber om ild parallelt for hastighet, men lyden spilles i streng rekkefølge → Kort stemme: når du lytter, vil du ikke ha et 2-minutters essay. Agenten bytter automatisk til 2-3 setningers samtalesvar i stemmemodus. Samme dybde er tilgjengelig hvis du spør om oppfølginger. To ikoner. Ett trykk. Spør Muntze hvordan porteføljen din går, og hør faktisk svaret mens du tjener Kaffe.