Op dit moment zijn we in de mindset dat de modellen zo snel veranderen en zo groot zijn dat de enige manier om op hen te vertrouwen is via roundtripping naar de hyperscaler. Dit is de dynamiek die zich voordeed met webservers. HTML veranderde zo snel dat apps die ermee waren geschreven sneller verbeterden dan "clientcode" ooit op traditionele manieren kon worden verspreid. Het probleem was dat de bandbreedte niet snel genoeg toenam. Dus dwong de beperking meer rekencapaciteit op servers te laten plaatsvinden. Dit vertraagde op zijn beurt de vooruitgang van "web UI" voor eindgebruikers. Zoals de chatinterface van vandaag de meest effectieve manier is om informatie heen en weer te sturen naar het model dat draait op een hyperscaler. Aangezien natuurlijke taal berucht onnauwkeurig is en heen en weer gaan een frustrerende manier is om te werken, lijkt het logisch dat meer gestructureerde interfaces hun weg zullen vinden naar het gebruik van modellen. En daarmee zal de "runtime" voor het gebruik van modellen geleidelijk migreren naar het apparaat om sneller en efficiënter te zijn. Dit is waarom je vandaag de dag, wanneer je een "webapp" gebruikt, hoewel het veel roundtrips maakt, ook gebruikmaakt van een zeer grote "edge" runtime die in de browser is opgenomen + de browsercache van uitvoerbare code.