Prata med din portfolio. Vi har precis skickat röst till Muntze: två lägen, samma inmatningsfält. Diktering: tappmikrofon, tala, ord visas i textfältet. Redigera innan jag skickar. Svaret kommer tillbaka som text. Samtal: tryck på vågformen, tala naturligt. Muntze lyssnar, tänker, och pratar sedan tillbaka till dig medan sms:et strömmar samtidigt. Den tekniska delen som är viktig: vi använder inte en inbyggd ljudmodell. Vi byggde en dual-streaming-pipeline: ditt tal går till Web Speech API, vår LLM bearbetar det, och Sonic syntetiserar svarmeningen- per mening när tokens anländer. Första ljudet spelas upp på under 400 ms efter att den första meningen bildats. De svåra problemen vi löste: → Eko-avstängning: STT pausar under uppspelning så att Muntze inte transkriberar sin egen röst och loopar för evigt → Meningsordning: TTS begär att eld ska avfyras parallellt för hastighet, men ljudet spelas upp i strikt sekvens → Röstkorthet: när du lyssnar vill du inte ha en två minuter lång uppsats. Agenten byter automatiskt till 2-3 meningar långa samtalssvar i röstläge. Samma djup finns om du frågar om följdfrågor. Två ikoner. Ett knack. Fråga Muntze hur det går för din portfolio och hör faktiskt svaret medan du tjänar Kaffe.