Apresentando o Voxtral Transcribe 2, modelos de voz para texto de próxima geração da @MistralAI. Transcrição de última geração, diarização de alto-falantes, latência em tempo real abaixo de 200ms. Detalhes em 🧵
Voxtral Realtime é feito para agentes de voz e aplicações ao vivo. Sua arquitetura de streaming nativo oferece latência configurável para menos de 200ms. E em 480ms, ele permanece dentro de 1-2% de WER do nosso modelo offline. Lançamos o modelo como peso aberto sob o Apache 2.0.
Comece a experimentar com Voxtral Mini Transcribe 2 no novo playground de áudio do Mistral Studio. Faça upload de arquivos, alterne a diarização, adicione viés de contexto e obtenha transcrições instantâneas.
Disponível agora. Mini Transcreva 2 via API a $0,003/min. Tempo real via API a $0,006/min, mais pesos abertos. Comece →
64