500 tisíc vzorků vícejazyčných dat po školení v 5 jazycích: francouzštině, španělštině, italštině, němčině a portugalštině. Abychom vyřešili nedostatek vícejazyčných datových sad po trénování, vytvořili jsme tyto vzorky a zjistili jsme, že zlepšují výkon ve srovnávacích testech, jako jsou Global MMLU, Belebele a Multi-IF
7,42K