AI svarer på spørsmålene dine på sekunder, men bak denne hastigheten ligger noe som kalles inferens—den beregningsintensive prosessen der trente modeller genererer svar. Hos AWS har vi bygget spesialtilpassede brikker som Trainium, intelligente rutingssystemer og enhetlig infrastruktur for å gjøre slutninger raskere og rimeligere. Ettersom AI-agenter håndterer komplekse flertrinnsoppgaver, står inferens for 80–90 % av AIs datakraft. Vi konstruerer på planetarisk skala for å holde disse millisekundene pålitelige.