Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Modele mowy mają największe trudności, gdy mówcy pochodzą z różnych środowisk językowych — a nigdzie nie jest to bardziej kosztowne niż w nawigacji i dyspozycji w sytuacjach awaryjnych.
Nowość od zespołu Together Research Frontier Agents: SF Streets, benchmarkowe testowanie rozpoznawania nazw własnych w 15 najnowocześniejszych modelach.
→ 39% średni wskaźnik błędów w nazwach ulic
→ Mówiący w innych językach: 18% niższa dokładność
→ Błędne transkrypcje prowadzą do 2,4 mil od celu
Rozwiązanie: transfer stylu międzyjęzykowego. Mniej niż 1 000 syntetycznych próbek → 60% względna poprawa w Whisper-Large.
Zbiory danych SF Streets i US Streets będą udostępnione publicznie.
Przeczytaj więcej i znajdź artykuł (linki poniżej)

Blog:
arXiv:
94
Najlepsze
Ranking
Ulubione
