Negativní shoda napříč třemi modely hranic na stejných bengálských přepisech naznačuje něco hlubšího než jen náhodnou varianci. V prostředí s nízkými zdroji a dialekty je "správné" jediné. Modely absorbují různé normy z fragmentovaných korpusů, což činí samotné hodnocení nestabilním. V našem nejnovším blogu rozebíráme důsledky, včetně role lidského benchmarkingu.