Automatizace převodu textu do SQL je stále velký úkol a existuje jen velmi málo dobrých modelů s otevřeným zdrojovým kódem pro tento úkol. Pojďme si to rozebrat - >Modely převodu textu na SQL nejsou v podstatě nic jiného než modely kodér-dekodér s vrstvou více pozorností a vrstvou propojující schéma mezi nimi. > Kodér zpracovává dotaz uživatele i schéma databáze a generuje kontextová vložení (kódování s ohledem na relace) >Prostřednictvím propojení schématu jsou tokeny v dotazu zarovnány s odpovídajícími entitami schématu >Mechanismus pozornosti s ohledem na schéma pak umožňuje modelu zaměřit se během dekódování na relevantní části schématu > Dekodér postupně vytváří SQL tokeny (dekódování založené na omezeních) Kde tyto modely chybí? - >Většina dostupných modelů postrádá složité dotazy v samotných trénovacích datech, a proto mají špatný výkon u dotazů mezi doménami nebo ve smyčce. > Požadavek na jazyk a dotaz není u běžného uživatele vždy správný. Dokonce i pravopisné chyby vedou k nesprávnému zadání a způsobují problémy při načítání, proto je výzva důležitou součástí tohoto úkolu. Osobně jsem na tom podrobně pracoval, když jsem dělal end-to-end projekt, dokonce jsem vytvořil syntetická data a zkoušel trénovat svůj vlastní SLM, ale žalostně jsem selhal a pak jsem pokračoval v používání Open-source modelu. Pokud se do toho chcete ponořit hlouběji, doporučoval bych si nejprve přečíst tyto výzkumné práce - >LLM vylepšená generace textu do SQL >Databázová rozhraní nové generace: >Text-to-SQL analýza: Koncepty a metody >RASAT: Integrace relačních struktur do předtrénovaného modelu Seq2Seq