Poseidon potřebuje hlasová data a spolehlivou pravdivost v málo zdrojových jazycích k benchmarkingu. Abychom zajistili přesnost přepisů LLM, spolupracovali jsme s lingvisty na auditu bengálských výstupů. U jazyka, kterým mluví 280 milionů lidí, ukazují nalezené mezery na hlubší problém: data ↓