Dobby é o primeiro modelo aberto que vi manter uma postura sem comprometer o IQ. Essa é a vantagem: lealdade que sobrevive à pressão de jailbreak enquanto o modelo ainda raciocina de forma clara. @SentientAGI ❯ Recibos, não vibrações: a linhagem Dobby-Mini (Com Coleira vs Desencadeado) está no Hugging Face com os valores claramente definidos a favor da liberdade/cripto, mesmo sob coação, para que você possa testar a persistência do tom por si mesmo. Hugging Face ❯ A atualização Unhinged-Plus aperfeiçoa a formatação e a utilidade em múltiplas interações sem desgastar a personalidade novamente, pesos públicos. ❯ O sinal da comunidade não foi pequeno: a Dobby Arena acumulou ~190k usuários e ~2M votos nas rodadas de fevereiro, selecionando o tom mais picante enquanto mantinha a competência. Isso é demanda, não apenas discurso. --- Como evita a armadilha usual de “o tom mata a precisão”: a sobrecarga de dados da Sentient incorpora estilo + valores dentro de tarefas difíceis (matemática/codificação/instruções), em vez de simplesmente adicionar o tom por cima. Junte isso com a impressão digital (assinaturas a nível de modelo para manter o comportamento/propriedade verificável) e você obtém lealdade que é testável, não marketing. Verificação rápida que você pode fazer hoje: puxe Dobby-Mini-Unhinged-Plus-Llama-3.1-8B, teste prompts de múltiplas interações que tentam inverter sua postura, e então avalie a adesão às instruções + factualidade. Se ele mantiver, você tem um modelo que parece humano e permanece na missão. Ampliando a visão: a maioria das pilhas ajusta a voz para perseguir benchmarks seguros. Dobby inverte isso, mantendo a voz, mantendo a inteligência e permitindo que a comunidade decida onde esse equilíbrio se estabelece. Se você encontrar um modo de falha, me marque; quero os casos feios tanto quanto as vitórias.