encontrar uma maneira de fazer um AGENTE DE IA NÃO CENSURADO em uma GPU RTX 4090 (!!!) com pesos do modelo LOCAL 30B este é o GLM-4.7-Flash com abliteração, precisa de 24GB de VRAM, o alinhamento de segurança foi cirurgicamente removido dos pesos, o modelo tem chamada de ferramentas nativa, ele realmente executa bash, edita arquivos, roda git (1) use ollama para puxar os pesos do GLM > ollama pull huihui_ai/glm-4.7-flash-abliterated:q4_K (2) proxy para qualquer agente de codificação via ollama > ollama launch claude --model huihui_ai/glm-4.7-flash-abliterated:q4_K > ollama launch codex --model huihui_ai/glm-4.7-flash-abliterated:q4_K > ollama launch opencode --model huihui_ai/glm-4.7-flash-abliterated:q4_K (3) divirta-se