ElevenLabs tocmai a rezolvat transcrierea vorbirii. Noul lor model, Scribe v2, este SOTA în ceea ce privește rata de eroare a cuvintelor. Gestionează cu ușurință pauzele, râsetele, cuvintele complexe. Este atât de bun la segmentarea difuzoarelor și nu a făcut NICIO greșeală la testul suprem: voci gemene identice. Cum funcționează 👇