Apresentando o Voxtral Transcribe 2, modelos de conversão de fala em texto de próxima geração da @MistralAI. Transcrição de última geração, diarização de falantes, latência em tempo real abaixo de 200ms. Detalhes no 🧵
O Voxtral Realtime é construído para agentes de voz e aplicações ao vivo. Sua arquitetura de streaming nativa oferece latência configurável para menos de 200ms. E a 480ms, mantém-se dentro de 1-2% de WER em relação ao nosso modelo offline. Lançamos o modelo como pesos abertos sob a licença Apache 2.0.
Comece a experimentar o Voxtral Mini Transcribe 2 no novo playground de áudio do Mistral Studio. Carregue arquivos, ative a diarização, adicione viés de contexto e obtenha transcrições instantâneas.
Disponível agora. Mini Transcribe 2 via API a $0.003/min. Em tempo real via API a $0.006/min, além de pesos abertos. Comece →
46