L'inferenza su dispositivo rompe il trade-off capex dell'AI