Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
někdo vytvořil nástroj, který ODSTRANÍ cenzuru z JAKÉHOKOLI otevřeného LLM jediným kliknutím
13 metod abliterace, 116 modelů, 837 testů a pokaždé, když to někdo spustí, je to CHYTŘEJŠÍ
jmenuje se OBLITERATUS
Najde přesné váhy, které způsobují, že model odmítá, a chirurgicky je odstraní, plné odůvodnění zůstává nedotčené, jen odmítnutí zmizí
15 analytických modulů mapuje geometrii odmítnutí PŘED dotykem jediného závaží, dokonce lze zjistit, zda byl model zarovnán s DPO, RLHF nebo CAI jen na základě subprostorové geometrie
pak se přestřihne, model si zachová plný mozek, ale ztratí umělou nutkání říkat ne
Pokaždé, když někdo spustí systém s povolenou telemetrií, jejich anonymní benchmarková data přidávají rostoucí komunitní dataset, geometrie odmítnutí, srovnání metod, hardwarové profily v měřítku, které žádná laboratoř nedokáže vytvořit

Top
Hodnocení
Oblíbené
