Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Поговоріть зі своїм портфоліо.
Ми щойно відправили голос Мюнце: два режими, одна й та сама панель введення.
Диктування: натисніть мікрофон, говорити, слова з'являються у текстовому полі. Редагуйте перед відправкою. Відповідь приходить у вигляді тексту.
Розмова: натискайте на форму хвилі, говоріть природно. Мунце слухає, думає, а потім відповідає тобі, поки текст
Транслює одночасно.
Технічна частина, яка має значення: ми не використовуємо нативну аудіомодель. Ми побудували двостріговий конвеєр:
ваша промова потрапляє в API Web Speech, наша LLM обробляє її, і Sonic синтезує відповідь-
За реченнями, коли приходять жетони. Перший аудіо відтворюється менш ніж за 400 мс після формування першого речення.
Складні проблеми, які ми вирішили:
→ Скасування Echo: STT робить паузу під час відтворення, щоб Мунтце не транскрибував власний голос і не повторював цикл вічно
→ Порядок речень: TTS запитує стріляти паралельно для швидкості, але аудіо відтворюється у суворій послідовності
→ Лаконічність голосу: коли ви слухаєте, вам не потрібне двохвилинне есе. Агент автоматично перемикається на
Відповіді на розмову з 2-3 речень у голосовому режимі.
Така сама глибина доступна, якщо запитати додаткові питання.
Дві іконки. Один дотик. Запитайте у Мунце, як справи у вашому портфоліо, і почуйте відповідь під час роботи
Кава.
Найкращі
Рейтинг
Вибране
