ElevenLabs только что решила проблему транскрипции речи. Их новая модель, Scribe v2, является SOTA по уровню ошибок слов. Она легко справляется с паузами, смехом, сложными словами. Она так хорошо сегментирует говорящих и не допустила ZERO ошибок на окончательном тесте: голоса идентичных близнецов. Как это работает 👇