I modelli di linguaggio faticano di più quando i relatori provengono da background linguistici diversi — e non c'è posto in cui questo sia più costoso che nella navigazione e nel servizio di emergenza. Nuovo dal team Together Research Frontier Agents: SF Streets, un benchmark per testare lo stress del riconoscimento di entità nominate attraverso 15 modelli all'avanguardia. → 39% di tasso medio di errore sui nomi delle strade → Parlanti non anglofoni: 18% di accuratezza in meno → Trascrizioni errate ti portano a 2,4 miglia di distanza dall'obiettivo La soluzione: trasferimento di stile cross-linguale. Meno di 1.000 campioni sintetici → 60% di miglioramento relativo su Whisper-Large. I dataset SF Streets e US Streets saranno rilasciati pubblicamente. Leggi di più e trova il documento (link qui sotto)
Blog: arXiv:
91