Przedstawiamy Voxtral Transcribe 2, modele mowy na tekst nowej generacji od @MistralAI. Transkrypcja na najwyższym poziomie, diarizacja mówców, opóźnienie w czasie rzeczywistym poniżej 200 ms. Szczegóły w 🧵
Voxtral Realtime jest stworzony dla agentów głosowych i aplikacji na żywo. Jego natywna architektura strumieniowa zapewnia opóźnienie konfigurowalne do poniżej 200 ms. A przy 480 ms pozostaje w granicach 1-2% WER naszego modelu offline. Udostępniamy model jako otwarte wagi na licencji Apache 2.0.
Zacznij eksperymentować z Voxtral Mini Transcribe 2 w nowym audio placu zabaw na Mistral Studio. Prześlij pliki, włącz diarizację, dodaj kontekstowe uprzedzenia i uzyskaj natychmiastowe transkrypcje.
Dostępne teraz. Mini Transcribe 2 przez API za $0.003/min. Realtime przez API za $0.006/min, plus otwarte wagi. Rozpocznij →
52