V roce 2021 jsem psal o tom, kam podle mého názoru rozpoznávání řeči směřuje do roku 2030. Zatím @argmax realizuje 2/5 předpovědí (na zařízení a personalizace). Stále pevně věřím v kontext a personalizaci, a to nejen pro převod řeči na text, ale i pro LLM / další modality.
argmax
argmax23. 10. 01:01
Představení vlastního slovníku v Argmax Pro SDK Přizpůsobte si převod řeči na text pomocí kontextových klíčových slov za běhu, abyste překonali přesnost obecných hraničních řečových modelů! Můžete si ji vyzkoušet na @superwhisperapp a @argmax hřišti ještě dnes. Více ukázek a podrobností v komentářích.
Relevantní úryvky a odkaz na příspěvek
14,7K