Obecnie jesteśmy w takim nastawieniu, że modele zmieniają się tak szybko i są tak duże, że jedynym sposobem, aby na nich polegać, jest korzystanie z roundtrippingu do hyperskalera. To jest dynamika, która miała miejsce z serwerami internetowymi. HTML zmieniał się tak szybko, że aplikacje napisane przy jego użyciu rozwijały się szybciej, niż „kod klienta” mógłby być dystrybuowany w tradycyjny sposób. Problem polegał na tym, że przepustowość nie rosła wystarczająco szybko. Tak więc ograniczenie zmusiło do większej obliczeniowej pracy na serwerach. To z kolei spowolniło rozwój „interfejsu webowego” dla użytkowników końcowych. Jak dzisiejszy interfejs czatu jest najskuteczniejszym sposobem przesyłania informacji w obie strony do modelu działającego na hyperscalerze. Ponieważ język naturalny jest notorycznie niedokładny, a wymiana informacji w obie strony jest frustrującym sposobem pracy, wydaje się naturalne, że bardziej zorganizowane interfejsy będą wkrótce wykorzystywać modele. A wraz z tym „czas wykonania” dla korzystania z modeli stopniowo przeniesie się na urządzenie, aby być szybszym i bardziej efektywnym. Dlatego dzisiaj, gdy korzystasz z „aplikacji webowej”, mimo że często wymaga ona roundtrippingu, korzysta również z bardzo dużego „edge” czasu wykonania zawartego w przeglądarce + pamięci podręcznej przeglądarki z kodem wykonywalnym.