Поговорите со своим портфелем. Мы только что выпустили голосовую функцию для Muntze: два режима, одна строка ввода. Диктовка: нажмите на микрофон, говорите, слова появляются в текстовом поле. Редактируйте перед отправкой. Ответ приходит в текстовом виде. Разговор: нажмите на звуковую волну, говорите естественно. Muntze слушает, обдумывает, а затем отвечает вам, пока текст передается одновременно. Техническая часть, которая имеет значение: мы не используем нативную аудиомодель. Мы построили двойной потоковый конвейер: ваша речь попадает в Web Speech API, наш LLM обрабатывает её, а Sonic синтезирует ответ предложение- за-предложением по мере поступления токенов. Первый звук воспроизводится менее чем через 400 мс после формирования первого предложения. Сложные задачи, которые мы решили: → Отмена эха: STT приостанавливается во время воспроизведения, чтобы Muntze не транскрибировал свой собственный голос и не зацикливался навсегда → Порядок предложений: запросы TTS выполняются параллельно для скорости, но аудио воспроизводится в строгой последовательности → Краткость голоса: когда вы слушаете, вы не хотите 2-минутное эссе. Агент автоматически переключается на 2-3 предложения в разговорных ответах в голосовом режиме. Такая же глубина доступна, если вы зададите дополнительные вопросы. Два значка. Один тап. Спросите Muntze, как дела у вашего портфеля, и на самом деле услышьте ответ, пока вы готовите кофе.