Omlouvám se, ale stále vidím příspěvky tohoto druhu, takže to musím objasnit. víme, že LM jsou invertibilní už DVA ROKY. Ukázal jsem to během svého doktorátu. citovaný článek přidává některá sofistikovaná rozšíření, ale "Inverze jazykového modelu" (Morris et al., ICLR 2024) to udělala jako první :)
Alex Imas
Alex Imas29. 10. 10:59
Svatá s*&t. Tento článek je šílený. Vstupní text z LLM můžete obnovit pomocí inverze. To má obrovské důsledky pro to, jak tyto modely chápeme, stejně jako pro věci, jako je ochrana soukromí.
- můžete obnovit výzvy pouze z výstupů, pokud máte dostatek času na vzorkování - můžete je rychleji obnovit binárním vyhledáváním v API, pokud umožňuje parametr 'logit bias' - v (Finlayson et al., 2024) je skvělé rozšíření: můžete obnovit *poslední vrstvu samotného modelu*
Inverze jazykového modelu
Logity LLM chráněných rozhraním API prozrazují proprietární informace
371