同じベンガル語の書き起こしに対して3つのフロンティアモデルで否定的な一致があったことは、単なるランダムな分散以上の何かを示唆しています。 資源が少なく方言が多い環境では、「正しい」は単独ではありません。モデルは断片化されたコーパスから異なる規範を取り込み、評価自体を不安定にします。 私たちは最新のブログで、人間のベンチマーキングの役割を含むその示唆を解説します。