Introductie van Voxtral Transcribe 2, next-gen spraak-naar-tekst modellen van @MistralAI. State-of-the-art transcriptie, spreker diarizatie, sub-200ms real-time latentie. Details in 🧵
Voxtral Realtime is gebouwd voor spraakagenten en live toepassingen. De natively streaming architectuur levert latentie die configureerbaar is tot onder de 200 ms. En met 480 ms blijft het binnen 1-2% WER van ons offline model. We geven het model vrij als open gewichten onder Apache 2.0.
Begin met experimenteren met Voxtral Mini Transcribe 2 in de nieuwe audio speelruimte op Mistral Studio. Upload bestanden, schakel diarization in, voeg contextbias toe en ontvang directe transcripties.
Nu beschikbaar. Mini Transcribe 2 via API voor $0,003/min. Realtime via API voor $0,006/min, plus open gewichten. Begin nu →
60