Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Той факт, що всі великі голосові режими ШІ працюють на дурних моделях, не кажучи вже про підлабузницькі дурні моделі, які створені так, щоб мати дисфлуктуації, що імітують людський чат («ем»), недооцінює цінність голосу в управлінні агентами.
«Серйозний голосовий режим» для роботи був би дуже корисним
Існують кращі моделі: голоси ШІ були невід'ємною частиною медіа вже майже століття. І є причина, чому комп'ютер із «Зоряного шляху» не сміявся, не зітхнув і не сказав «ем» і не сказав, наскільки ти був чудовим посеред завдання з високими ставками.
Також надзвичайно складно створити цей розумний голосовий режим з поточними API. Потрібно фактично транскрибувати голос у розумну модель за допомогою одного інструменту, а потім використовувати TTS з іншим, який не має тієї перерви та перериваності, як повноцінний мультимодальний голос.
144
Найкращі
Рейтинг
Вибране
