Hajautettu tallennus muutti tekoälymallien jakelun taloutta. Keskitetyn mallin hosting-kustannukset skaalautuvat lineaarisesti käytön mukaan. Jokainen päättelypyyntö osuu samoihin palvelimiin, kaistanleveyskustannukset kasvavat, ja palveluntarjoajat siirtävät nämä kustannukset käyttäjille API-hinnoittelun kautta. Siksi GPT-4:n API-kutsut maksavat sen, mitä ne tekevät: joku maksaa laskenta- ja kaistanleveydestä laajassa mittakaavassa. Hajautetussa tallennustilassa, kuten 0G:n DA-kerroksessa, mallipainot jakautuvat solmujen kesken. Käyttäjät hakevat tietoa lähimmästä solmusta sen sijaan, että murskaisivat keskuspalvelimia. Kaistanleveyskustannukset jakautuvat verkon yli. Yhtäkkiä 70B-parametrin mallin isännöinti ei vaadi kuusinumeroista kuukausittaista infrastruktuuria. Tämä ei tee tekoälystä vain halvempaa. Se tekee täysin uusista jakelumalleista käyttökelpoisia: malleja, jotka päivittyvät usein, malleja joilla on alueellisia variantteja, malleja, joita käyttäjät voivat ajaa paikallisesti ensimmäisen latauksen jälkeen. Rajoite ei koskaan ollut mallin laatu, vaan jakelutalous.