biri, tek bir tıklamayla HER açık ağırlıklı LLM'den sansürü KALDIRAN bir araç geliştirdi 13 abliterasyon yöntemi, 116 model, 837 test ve her biri çalıştırdığında daha AKILLI oluyor adı OBLITERATUS Modelin reddetmesine neden olan tam ağırlıkları bulur ve cerrahi olarak çıkarır, tam mantık kalır, sadece reddetme kaybolur 15 analiz modülü, tek bir ağırlıkta dokunmadan önce reddetme geometrisini haritalar, hatta sadece alt uzay geometrisinden bir modelin DPO ile RLHF ve CAI ile hizalanıp hizalanmadığını bile parmak izi olarak alabilir Sonra kesiyor, model tam beynini koruyor ama hayır deme yapay zorunluluğunu kaybediyor Biri her kez, anonim kıyaslama veri ile çalıştırıldığında, büyüyen bir topluluk veri seti, reddetme geometrileri, yöntem karşılaştırmaları, donanım profilleri ve hiçbir laboratuvarın oluşturamayacağı ölçekte bir şekilde yayınlar