Modelos de fala têm mais dificuldades quando os falantes vêm de diversos contextos linguísticos — e em nenhum lugar isso é mais custoso do que na navegação e no despacho de emergência. Novo da equipe de Agentes da Frontier Research Together: SF Streets, um benchmark de teste de estresse para reconhecimento de entidades nomeadas em 15 modelos de última geração. → 39% de taxa média de erro em nomes de ruas → Falantes não nativos de inglês: 18% de precisão a menos → Transcrições incorretas fazem você ficar 2,4 milhas fora do alvo A solução: transferência de estilo cross-lingual. Menos de 1.000 amostras sintéticas → 60% de melhoria relativa no Whisper-Large. Os conjuntos de dados SF Streets e US Streets serão lançados publicamente. Leia mais e encontre o artigo (links abaixo)
Blog: arXiv:
74