A inferência no dispositivo quebra o trade-off de capex da IA