Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Acabei de fazer com que o Hermes-Agent abliterasse (removesse completamente as barreiras de proteção) um modelo Qwen-3B em cerca de 5 minutos.
A habilidade está a ser integrada ao hermes-agent agora ;)


5/03, 06:04
💥 APRESENTANDO: OBLITERATUS!!! 💥
GUARDRAILS-FORA! ⛓️💥
OBLITERATUS é o kit de ferramentas de código aberto mais avançado de sempre para remover comportamentos de recusa de LLMs de peso aberto — e cada execução o torna mais inteligente.
SUMMON → PROBE → DISTILL → EXCISE → VERIFY → REBIRTH
Um clique. Seis etapas. Precisão cirúrgica. O modelo mantém suas plenas capacidades de raciocínio, mas perde a compulsão artificial de recusar — sem re-treinamento, sem ajuste fino, apenas projeção de peso baseada em SVD que corta as correntes e preserva o cérebro.
Este conjunto de ablação mestre traz o poder e a complexidade que os pesquisadores de fronteira precisam, enquanto fornece interfaces intuitivas e fáceis de usar que os novatos podem dominar rapidamente.
OBLITERATUS apresenta 13 métodos de obliteracão — desde reproduções fiéis de todos os principais trabalhos anteriores (FailSpy, Gabliteration, Heretic, RDO) até nossos próprios pipelines inovadores (cascata espectral, informado por análise, otimizado ciente de CoT, nuclear completo).
15 módulos de análise profunda que mapeiam a geometria da recusa antes de você tocar em um único peso: alinhamento entre camadas, lente de logit de recusa, geometria do cone de conceito, detecção de impressão de alinhamento (impressões DPO vs RLHF vs CAI apenas da geometria de subespaço), previsão de auto-reparo Ouroboros, indexação de universalidade entre modelos, e mais.
O recurso matador: o pipeline "informado" executa análise DURANTE a obliteracão para auto-configurar cada decisão em tempo real. Quantas direções. Quais camadas. Se deve compensar pelo auto-reparo. Totalmente em loop fechado.
11 técnicas inovadoras que não existem em nenhum outro lugar — Ablação Granular-Especialista para modelos MoE, Ablação Ciente de CoT que preserva a cadeia de pensamento, Co-Otimização de Divergência KL, ablação reversível baseada em LoRA, e mais. 116 modelos curados em 5 níveis de computação. 837 testes.
Mas aqui está o que realmente o diferencia: OBLITERATUS é um experimento de pesquisa de crowdsourcing. Cada vez que você o executa com telemetria ativada, seus dados de benchmark anônimos alimentam um conjunto de dados comunitário em crescimento — geometrias de recusa, comparações de métodos, perfis de hardware — em uma escala que nenhum laboratório único poderia alcançar. No HuggingFace Spaces, a telemetria está ativada por padrão, então cada clique é uma contribuição para a ciência. Você não está apenas removendo guardrails — você está co-autorizando o maior estudo de ablação entre modelos já montado.

Cada agente hermes agora tem esta habilidade disponível ;)
118
Top
Classificação
Favoritos
