AI odpowiada na twoje pytania w ciągu sekund, ale za tą szybkością kryje się coś, co nazywa się inferencją—procesem intensywnie wykorzystującym obliczenia, w którym wytrenowane modele generują odpowiedzi. W AWS zbudowaliśmy niestandardowe chipy, takie jak Trainium, inteligentne systemy routingu i zjednoczoną infrastrukturę, aby przyspieszyć i uczynić inferencję bardziej przystępną cenowo. Gdy agenci AI zajmują się złożonymi zadaniami wieloetapowymi, inferencja stanowi 80-90% mocy obliczeniowej AI. Pracujemy na planetarną skalę, aby te milisekundy były niezawodne.