Saat ini kami berada dalam pola pikir bahwa model berubah begitu cepat dan sangat besar sehingga satu-satunya cara untuk mengandalkannya adalah melalui roundtrip ke hyperscaler. Ini adalah dinamika yang terjadi dengan server web. HTML berubah begitu cepat sehingga aplikasi yang ditulis menggunakannya meningkat lebih cepat daripada "kode klien" yang dapat didistribusikan dengan cara tradisional. Masalahnya adalah bandwidth tidak meningkat cukup cepat. Jadi kendala tersebut memaksa lebih banyak komputasi terjadi di server. Ini pada gilirannya memperlambat kemajuan "web UI" untuk pengguna akhir. Seperti antarmuka obrolan saat ini adalah cara paling efektif untuk mengantarkan informasi bolak-balik ke model yang berjalan pada hyperscaler. Karena bahasa alami terkenal tidak tepat dan bolak-balik adalah cara yang membuat frustrasi untuk melakukan pekerjaan, tampaknya wajar bahwa antarmuka yang lebih terstruktur akan menggunakan model. Dan dengan itu "runtime" untuk menggunakan model secara bertahap akan bermigrasi ke perangkat agar lebih cepat dan efisien. Inilah sebabnya mengapa hari ini ketika Anda menggunakan "aplikasi web" meskipun sering bolak-balik, itu juga menggunakan runtime "edge" yang sangat besar yang terkandung dalam browser + cache browser dari kode yang dapat dieksekusi.