Einführung von Voxtral Transcribe 2, Next-Gen Sprach-zu-Text-Modelle von @MistralAI. State-of-the-Art Transkription, Sprecher-Diarisation, Echtzeit-Latenz unter 200 ms. Details in 🧵
Voxtral Realtime ist für Sprachagenten und Live-Anwendungen konzipiert. Seine nativ streamende Architektur liefert eine Latenz, die auf unter 200 ms konfiguriert werden kann. Und bei 480 ms bleibt es innerhalb von 1-2 % WER unseres Offline-Modells. Wir veröffentlichen das Modell als offene Gewichte unter Apache 2.0.
Beginnen Sie mit dem Experimentieren mit Voxtral Mini Transcribe 2 im neuen Audio-Spielplatz auf Mistral Studio. Laden Sie Dateien hoch, aktivieren Sie die Diarisierung, fügen Sie Kontextbias hinzu und erhalten Sie sofortige Transkriptionen.
Jetzt verfügbar. Mini Transcribe 2 über API für $0.003/Min. Echtzeit über API für $0.006/Min, plus offene Gewichte. Loslegen →
57