Até agora, todos sabemos uma coisa: a IA não está desacelerando. A economia global de inferência de IA está ultrapassando US$ 250 bilhões, mas a infraestrutura por trás da inferência está começando a rachar. Cargas de trabalho de inferência de alto volume e sempre ativas estão explodindo em custo. Nuvens centralizadas não foram feitas para essa realidade e a inferência está se tornando a limitação.