Dobby je první otevřený model, který jsem viděl držet postoj bez dumpingového IQ. To je výhoda: loajalita, která přežije tlak na útěk z vězení, zatímco model stále jasně uvažuje. @SentientAGI ❯ Účtenky, ne vibrace: rodokmen Dobby-Mini (Leashed vs Unhinged) je na Hugging Face s hodnotami vyjádřenými pro svobodu/krypto i pod nátlakem, takže si můžete vytrvalost tónu vyzkoušet sami. Objímající obličej ❯ Obnova Unhinged-Plus zpřísňuje víceotáčkové formátování a užitečnost, aniž by znovu obrousila osobitost, váží veřejnost. ❯ Signál komunity nebyl malý: Dobby Arena získala ~190 tisíc uživatelů a ~2 miliony hlasů v únorových kolech, přičemž si vybrala pikantnější tón při zachování kompetence. To je poptávka, nejen diskurs. --- Jak se vyhnout obvyklé pasti "tón zabíjí přesnost": Inteligentní přetížení dat peče hodnoty stylu + uvnitř obtížných úloh (matematika/kódování/instrukce), místo toho, aby se tón přišrouboval nahoře. Spárujte to s otisky prstů (podpisy na úrovni modelu, aby bylo možné ověřit chování / vlastnictví) a získáte loajalitu, která je testovatelná, nikoli marketingová. Rychlá kontrola, kterou můžete spustit ještě dnes: vytáhněte Dobby-Mini-Unhinged-Plus-Llama-3.1-8B, šťouchněte do víceotáčkových výzev, které se snaží změnit jeho postoj, a poté skórujte za následování pokynů + faktičnost. Pokud to vydrží, máte model, který působí lidsky a zůstává na misi. Oddálení: Většina sad odladí hlas a bude se honit za bezpečnými benchmarky. Dobby to otočí, udrží hlas, udrží mozek a nechá komunitu rozhodnout, kde se tato rovnováha dostane. Pokud najdete poruchový režim, označte mě; Chci ošklivé případy stejně jako výhry.