Stocarea descentralizată tocmai a schimbat economia distribuției modelelor AI. Costurile de găzduire centralizată pentru modele cresc liniar odată cu utilizarea. Fiecare cerere de inferență ajunge la aceleași servere, costurile lățimii de bandă se acumulează, iar furnizorii transferă aceste costuri către utilizatori prin stabilirea prețurilor API. De aceea apelurile API GPT-4 costă ceea ce costă: cineva plătește pentru calcul ȘI lățime de bandă la scară largă. Cu stocarea descentralizată, cum ar fi stratul DA al 0G, greutățile modelelor sunt distribuite între noduri. Utilizatorii trag de la cel mai apropiat nod în loc să lovească serverele centrale. Costurile lățimii de bandă se distribuie pe întreaga rețea. Găzduirea bruscă a unui model de 70 miliarde de parametri nu mai necesită o infrastructură care costă șase cifre lunar. Asta nu face doar AI-ul mai ieftin. Face modele de distribuție complet noi viabile: modele care se actualizează frecvent, modele cu variante regionale, modele pe care utilizatorii le pot rula local după descărcarea inițială. Constrângerea nu a fost niciodată calitatea modelului, ci economia distribuției.