Představujeme Voxtral Transcribe 2, nové generace modelů převodu řeči na text od @MistralAI. Špičková transkripce, diarizace mluvčích, latence pod 200 ms v reálném čase. Podrobnosti v 🧵
Voxtral Realtime je vytvořen pro hlasové agenty a živé aplikace. Jeho nativní streamovací architektura poskytuje latenci nastavitelnou pod 200 ms. A při 480 ms zůstává v rámci 1-2 % WER oproti našemu offline modelu. Model vydáváme jako otevřené váhy v rámci Apache 2.0.
Začněte experimentovat s Voxtral Mini Transcribe 2 v novém audio hřišti na Mistral Studio. Nahrávejte soubory, zapínejte diarizaci, přidáváte kontextovou zaujatost a získejte okamžité přepisy.
Dostupné nyní. Mini Transcribe 2 přes API za 0,003 $/min. Reálný čas přes API za 0,006 $/min, plus otevřené váhy. Začněte →
80