he encontrado una manera de hacer un AGENTE DE IA SIN CENSURA en una GPU RTX 4090 (!!!) con pesos de modelo LOCAL 30B este es GLM-4.7-Flash con abliteración, necesita 24GB de VRAM, la alineación de seguridad ha sido eliminada quirúrgicamente de los pesos, el modelo tiene llamada de herramientas nativa, realmente ejecuta bash, edita archivos, ejecuta git (1) usa ollama para obtener los pesos de GLM > ollama pull huihui_ai/glm-4.7-flash-abliterated:q4_K (2) proxy a cualquier agente de codificación a través de ollama > ollama launch claude --model huihui_ai/glm-4.7-flash-abliterated:q4_K > ollama launch codex --model huihui_ai/glm-4.7-flash-abliterated:q4_K > ollama launch opencode --model huihui_ai/glm-4.7-flash-abliterated:q4_K (3) diviértete