Hiện tại, chúng ta đang có tư duy rằng các mô hình đang thay đổi quá nhanh và quá lớn đến nỗi cách duy nhất để tin tưởng vào chúng là thông qua việc quay vòng đến hyperscaler. Đây là động lực đã xảy ra với các máy chủ web. HTML đang thay đổi quá nhanh đến nỗi các ứng dụng được viết bằng nó đang cải thiện nhanh hơn so với "mã khách" có thể được phân phối theo cách truyền thống. Vấn đề là băng thông không tăng đủ nhanh. Vì vậy, ràng buộc này đã buộc nhiều tính toán hơn phải diễn ra trên các máy chủ. Điều này lại làm chậm tiến độ của "giao diện web" cho người dùng cuối. Giống như giao diện trò chuyện ngày nay là cách hiệu quả nhất để chuyển thông tin qua lại với mô hình đang chạy trên hyperscaler. Vì ngôn ngữ tự nhiên nổi tiếng là không chính xác và việc trao đổi qua lại là một cách làm việc gây khó chịu, có vẻ tự nhiên rằng các giao diện có cấu trúc hơn sẽ dần dần được sử dụng với các mô hình. Và với điều đó, "thời gian chạy" để sử dụng các mô hình sẽ dần dần di chuyển vào thiết bị để trở nên nhanh hơn và hiệu quả hơn. Đó là lý do tại sao ngày nay khi bạn sử dụng một "ứng dụng web" mặc dù nó quay vòng nhiều, nó cũng tận dụng một "thời gian chạy" rất lớn ở "edge" được chứa trong trình duyệt + bộ nhớ cache của trình duyệt cho mã thực thi.