AI odpovídá na vaše otázky během několika sekund, ale za touto rychlostí stojí něco, čemu se říká inference – výpočetně náročný proces, kdy trénované modely generují odpovědi. V AWS jsme vytvořili vlastní čipy jako Trainium, inteligentní směrovací systémy a sjednocenou infrastrukturu, abychom zrychlili a zpřístupnili inferenci. Protože AI agenti zvládají složité vícestupňové úkoly, inference tvoří 80–90 % výkonu AI výpočetní síly. Navrhujeme na planetární úrovni, abychom udrželi ty milisekundy spolehlivé.