De meeste autonome systemen van vandaag vertrouwen nog steeds op blinde vertrouwen. We vertrouwen erop dat agenten: • Handelen zoals bedoeld • Binnen de grenzen blijven • Schadelijk gedrag vermijden Maar vertrouwen zonder handhaving schaalt niet, vooral niet voor software.
Blind vertrouwen ziet er meestal zo uit: • Brede API-sleutels • Langlevende referenties • Impliciete machtigingen • Monitoring achteraf Als er iets misgaat, stappen mensen in nadat de schade is aangericht. Dat is reactief, geen veilige autonomie.
Naarmate agenten capabeler worden, wordt blinde vertrouwen riskanter. Meer intelligentie betekent: • Breder actiegebied • Snellere uitvoering • Grotere explosieradius Zonder harde limieten kan een enkele fout zich onmiddellijk verspreiden.
Programmeerbare beperkingen veranderen het model. In plaats van intentie te vertrouwen, handhaven systemen regels: • Wat een agent kan doen • Hoeveel het kan uitgeven • Wanneer de autoriteit verloopt • Welke acties escalatie vereisen Beperkingen worden uitgevoerd door code, niet door beleid.
Dit verschuift de veiligheid van menselijke beoordeling naar infrastructuur. Beperkingen kunnen zijn: • Afgebakend (alleen specifieke acties) • Tijdgebonden (sessie-beperkt) • Budget-beperkt (uitgavenlimieten) • Automatisch intrekbaar Geen aannames. Geen giswerk.
Belangrijk is dat programmeerbare beperkingen de autonomie niet verminderen. Ze maken het mogelijk. Wanneer agenten binnen afgedwongen grenzen opereren, kunnen ze onafhankelijk handelen zonder constante controle of handmatige goedkeuringen.
Vertrouwen wordt in dit model verifieerbaar. Elke actie kan zijn: • Geautoriseerd • Beperkingsgecontroleerd • Gelogd • Geaudit na uitvoering Vertrouwen is niet langer sociaal of subjectief, het is bewijsbaar.
Blinde vertrouwen vraagt: “Geloven we dat deze agent zich zal gedragen?” Programmeerbare beperkingen vragen: “Wat mag deze agent doen?” Slechts één van deze schalen is veilig.
De toekomst van autonome systemen zal niet afhangen van betere beloftes of striktere beleidsregels. Het zal afhangen van infrastructuur die standaard grenzen afdwingt. Daarom is Kite gebouwd rond programmeerbare beperkingen, niet blinde vertrouwen 🪁
198