DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Prata med din portfolio. Vi har precis skickat röst till Muntze: två lägen, samma inmatningsfält. Diktering: tappmikrofon, tala, ord visas i textfältet. Redigera innan jag skickar. Svaret kommer tillbaka som text. Samtal: tryck på vågformen, tala naturligt. Muntze lyssnar, tänker, och pratar sedan tillbaka till dig medan sms:et strömmar samtidigt. Den tekniska delen som är viktig: vi använder inte en inbyggd ljudmodell. Vi byggde en dual-streaming-pipeline: ditt tal går till Web Speech API, vår LLM bearbetar det, och Sonic syntetiserar svarmeningen- per mening när tokens anländer. Första ljudet spelas upp på under 400 ms efter att den första meningen bildats. De svåra problemen vi löste: → Eko-avstängning: STT pausar under uppspelning så att Muntze inte transkriberar sin egen röst och loopar för evigt → Meningsordning: TTS begär att eld ska avfyras parallellt för hastighet, men ljudet spelas upp i strikt sekvens → Röstkorthet: när du lyssnar vill du inte ha en två minuter lång uppsats. Agenten byter automatiskt till 2-3 meningar långa samtalssvar i röstläge. Samma djup finns om du frågar om följdfrågor. Två ikoner. Ett knack. Fråga Muntze hur det går för din portfolio och hör faktiskt svaret medan du tjänar Kaffe.

Topp

Rankning

Favoriter