Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Поговорите со своим портфелем.
Мы только что выпустили голосовую функцию для Muntze: два режима, одна строка ввода.
Диктовка: нажмите на микрофон, говорите, слова появляются в текстовом поле. Редактируйте перед отправкой. Ответ приходит в текстовом виде.
Разговор: нажмите на звуковую волну, говорите естественно. Muntze слушает, обдумывает, а затем отвечает вам, пока текст
передается одновременно.
Техническая часть, которая имеет значение: мы не используем нативную аудиомодель. Мы построили двойной потоковый конвейер:
ваша речь попадает в Web Speech API, наш LLM обрабатывает её, а Sonic синтезирует ответ предложение-
за-предложением по мере поступления токенов. Первый звук воспроизводится менее чем через 400 мс после формирования первого предложения.
Сложные задачи, которые мы решили:
→ Отмена эха: STT приостанавливается во время воспроизведения, чтобы Muntze не транскрибировал свой собственный голос и не зацикливался навсегда
→ Порядок предложений: запросы TTS выполняются параллельно для скорости, но аудио воспроизводится в строгой последовательности
→ Краткость голоса: когда вы слушаете, вы не хотите 2-минутное эссе. Агент автоматически переключается на
2-3 предложения в разговорных ответах в голосовом режиме.
Такая же глубина доступна, если вы зададите дополнительные вопросы.
Два значка. Один тап. Спросите Muntze, как дела у вашего портфеля, и на самом деле услышьте ответ, пока вы готовите
кофе.
Топ
Рейтинг
Избранное
