يجيب الذكاء الاصطناعي على أسئلتك في ثوان، لكن وراء تلك السرعة يوجد شيء يسمى الاستنتاج—العملية المكثفة في الحوسبة حيث تولد النماذج المدربة ردودا. في AWS، قمنا ببناء شرائح مخصصة مثل Trainium، وأنظمة توجيه ذكية، وبنية تحتية موحدة لجعل الاستدلال أسرع وأكثر توفيرا. نظرا لأن وكلاء الذكاء الاصطناعي يتعاملون مع مهام معقدة متعددة الخطوات، فإن الاستدلال يمثل 80-90٪ من قوة الحوسبة في الذكاء الاصطناعي. نحن نهندس على نطاق الكواكب للحفاظ على موثوقية تلك الميليثانية.