Présentation de Voxtral Transcribe 2, des modèles de transcription vocale de nouvelle génération par @MistralAI. Transcription à la pointe de la technologie, diarisation des locuteurs, latence en temps réel inférieure à 200 ms. Détails dans 🧵
Voxtral Realtime est conçu pour les agents vocaux et les applications en direct. Son architecture de streaming natif offre une latence configurable à moins de 200 ms. Et à 480 ms, il reste dans une marge de 1 à 2 % de WER par rapport à notre modèle hors ligne. Nous publions le modèle sous forme de poids ouverts sous Apache 2.0.
Commencez à expérimenter avec Voxtral Mini Transcribe 2 dans le nouveau terrain de jeu audio sur Mistral Studio. Téléchargez des fichiers, activez la diarisation, ajoutez un biais contextuel et obtenez des transcriptions instantanées.
Disponible maintenant. Mini Transcribe 2 via API à 0,003 $/min. Temps réel via API à 0,006 $/min, plus poids ouverts. Commencez →
58