A maioria dos sistemas autônomos hoje ainda depende da confiança cega. Confiamos que os corretores irão: • Agir conforme pretendido • Manter-se dentro dos limites • Evitar comportamentos prejudiciais Mas confiança sem fiscalização não escala, especialmente para software.
Confiança cega geralmente é assim: • Chaves de API amplas • Credenciais duradouras • Permissões implícitas • Monitoramento pós-ocorrido Se algo der errado, os humanos intervêm depois que o dano já é causado. Isso é reativo, não autonomia segura.
À medida que os agentes se tornam mais capazes, a confiança cega se torna mais arriscada. Mais inteligência significa: • Espaço de ação mais amplo • Execução mais rápida • Maior raio de explosão Sem limites rígidos, um único erro pode se propagar instantaneamente.
Restrições programáveis mudam o modelo. Em vez de confiar na intenção, os sistemas aplicam regras: • O que um agente pode fazer • Quanto pode gastar • Quando a autoridade expira • Quais ações exigem escalonamento As restrições são executadas por código, não por política.
Isso transfere a segurança do julgamento humano para a infraestrutura. As restrições podem ser: • Escopo (apenas ações específicas) • Tempo limitado (por sessão) • Limitado pelo orçamento (limites de gastos) • Revogável automaticamente Sem suposições. Sem suposições.
Importante destacar que restrições programáveis não reduzem a autonomia. Eles possibilitam isso. Quando os agentes operam dentro de limites impostos, podem agir de forma independente, sem supervisão constante ou aprovações manuais.
A confiança, nesse modelo, torna-se verificável. Cada ação pode ser: • Autorizado • Verificação por restrições • Registrado • Auditado após a execução Confiança não é mais social ou subjetiva, é comprovável.
Blind Trust pergunta: "Acreditamos que esse agente vai se comportar?" Restrições programáveis perguntam: "O que esse agente pode fazer?" Apenas uma dessas balanças é segura.
O futuro dos sistemas autônomos não dependerá de promessas melhores ou políticas mais rígidas. Vai depender da infraestrutura que impõe limites por padrão. Por isso o Kite é construído em torno de restrições programáveis, não de confiança 🪁 cega
202