AI beantwoordt je vragen in seconden, maar achter die snelheid schuilt iets dat inferentie wordt genoemd—het compute-intensieve proces waarbij getrainde modellen antwoorden genereren. Bij AWS hebben we aangepaste chips zoals Trainium, intelligente routeringssystemen en een verenigde infrastructuur gebouwd om inferentie sneller en betaalbaarder te maken. Terwijl AI-agenten complexe meerstaps taken afhandelen, vertegenwoordigt inferentie 80-90% van de AI-rekenkracht. We zijn aan het engineeringswerk op planetair niveau om die milliseconden betrouwbaar te houden.