Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Apresentando Agentes de Voz: Uma Estrutura 🗣️👾 Totalmente Nova para Agentes de Voz de Nível Empresarial
Construir fluxos de trabalho agentes com voz ficou mais fácil, rápido e confiável.
Voice-Agents é um framework Python totalmente novo e pronto para produção que oferece integração perfeita com múltiplos provedores TTS/STT, streaming em tempo real e tudo o que você precisa para construir assistentes agentes conversacionais.
> Suporte multi-provedor: OpenAI, ElevenLabs e Groq
> Streaming em tempo real para interações com agentes de baixa latência
> Pronto para produção com registro empresarial, telemetria e manejo de erros
Saiba Mais ⬇️🧵
2 /
Suporte TTS Multi-Provedor
Alterne entre provedores facilmente com uma API unificada. Seja você quem precisa das vozes naturais da OpenAI, das opções expressivas da ElevenLabs ou da rápida dedução da Groq, a Voice-Agents lida com tudo isso com interfaces consistentes.
> 10+ vozes OpenAI (liga, nova, brilho e mais)
> 30+ vozes ElevenLabs com controle avançado de voz
> função Unified stream_tts() funciona em todos os provedores
Exemplos:

3 /
Arquitetura de Streaming em Tempo Real
Construído para sistemas baseados em agentes que precisam de streaming de áudio de baixa latência. Os Voice-Agents processam os trechos de áudio à medida que chegam, possibilitando conversas naturais sem pausas constrangedoras ou atrasos.
> StreamingTTSCallback fala automaticamente frases completas a partir das saídas dos agentes
> Streaming baseado em gerador para FastAPI e aplicações web
> Detecção inteligente de frases para pausas naturais na fala
Github:

4 /
Capacidades Avançadas de Voz para Texto
Transcrição de alta precisão alimentada pela OpenAI Whisper e ElevenLabs STT. Suporta múltiplos formatos de entrada, diarização de alto-falantes, carimbos de horário e detecção de idiomas para processamento de áudio completo.
> Transcrição de áudio baseada em arquivos e em tempo real
> Diarização do alto-falante e extração de carimbo de data e hora
> Suporte para matrizes numpy, arquivos de áudio e áudio em streaming
Exemplos:

5 /
Infraestrutura pronta para produção
Recursos de nível empresarial embutidos em cada componente. Desde pooling de conexões e suporte a HTTP/2 até o tratamento abrangente de erros e segurança de tipos, o Voice-Agents é projetado para escalar.
> Cliente HTTP otimizado com pool de conexão e keepalive
> Dicas de tipo completo e tipos literais para melhor suporte ao IDE
> Utilitários de áudio embutidos: gravação, reprodução, conversão de formatos

6 /
Casos de Uso: De Agentes de Trading a Assistentes de Voz
Agentes de Voz impulsionam aplicações do mundo real em diversos setores. Construa sistemas de negociação habilitados por voz, assistentes de IA conversacionais, serviços de transcrição em tempo real e aplicações multimodais com experiências interativas ricas.
> Agentes de negociação habilitados por voz com narração de mercado em tempo real
> Assistentes de IA conversacional com síntese natural de fala
> Sistemas de transcrição de reuniões e processamento de entrevistas
7 /
Integração de Enxames Contínuos
Parte do ecossistema Swarms, a estrutura de orquestração multiagente de nível empresarial. O Voice-Agents integra-se diretamente aos agentes Swarms, possibilitando sistemas multiagente habilitados por voz logo de fábrica.
> Funciona perfeitamente com a classe Agente de Enxames
> Streaming de retornos de chamada para respostas de agentes em tempo real
> Comece: instalar pip voice-agents

29
Melhores
Classificação
Favoritos
