Поговоріть зі своїм портфоліо. Ми щойно відправили голос Мюнце: два режими, одна й та сама панель введення. Диктування: натисніть мікрофон, говорити, слова з'являються у текстовому полі. Редагуйте перед відправкою. Відповідь приходить у вигляді тексту. Розмова: натискайте на форму хвилі, говоріть природно. Мунце слухає, думає, а потім відповідає тобі, поки текст Транслює одночасно. Технічна частина, яка має значення: ми не використовуємо нативну аудіомодель. Ми побудували двостріговий конвеєр: ваша промова потрапляє в API Web Speech, наша LLM обробляє її, і Sonic синтезує відповідь- За реченнями, коли приходять жетони. Перший аудіо відтворюється менш ніж за 400 мс після формування першого речення. Складні проблеми, які ми вирішили: → Скасування Echo: STT робить паузу під час відтворення, щоб Мунтце не транскрибував власний голос і не повторював цикл вічно → Порядок речень: TTS запитує стріляти паралельно для швидкості, але аудіо відтворюється у суворій послідовності → Лаконічність голосу: коли ви слухаєте, вам не потрібне двохвилинне есе. Агент автоматично перемикається на Відповіді на розмову з 2-3 речень у голосовому режимі. Така сама глибина доступна, якщо запитати додаткові питання. Дві іконки. Один дотик. Запитайте у Мунце, як справи у вашому портфоліо, і почуйте відповідь під час роботи Кава.