Latens = fysikk. Det meste av "AI-forsinkelse" er ikke kode, det er avstand. Tenk gaming ping. Inference ønsker å kjøre i nærheten av brukeren, ikke i et fjerntliggende datasenter. Det er derfor nettverk med GPUer i periferien reduserer ventetiden betydelig. DeAI er CDN for intelligens.