Kompresja modeli AI właśnie uczyniła wnioskowanie onchain ekonomicznie opłacalnym po raz pierwszy. Uruchomienie modelu o 7 miliardach parametrów kosztowało wcześniej 2-3 USD za wywołanie wnioskowania, gdy uwzględnisz opłaty za gaz i koszty obliczeniowe. Taka cena sprawia, że każda aplikacja AI skierowana do konsumentów jest skazana na porażkę. Nie możesz zbudować chatbota, który kosztuje użytkowników 2 USD za wiadomość. Ekonomia nigdy nie działała. Techniki kwantyzacji i przycinania kompresują modele do 1-2 miliardów parametrów bez dużej utraty dokładności. Nagle koszty wnioskowania spadają do 0,10-0,20 USD za wywołanie. Wciąż nie jest to darmowe, ale teraz jesteś w zakresie, w którym modele mikropłatności stają się opłacalne. Użytkownicy mogą płacić ułamki centa za interakcję, deweloperzy mogą pokrywać koszty bez subsydiów od VC, a ekonomika jednostkowa rzeczywiście się zamyka. Gdy wnioskowanie stanie się wystarczająco tanie, aby wspierać prawdziwe aplikacje, a nie tylko dema, odblokowujesz zupełnie inny obszar projektowy. Agenci AI, którzy żyją w pełni onchain, ciągle wchodzą w interakcje z użytkownikami i nie wymagają scentralizowanych zależności API. Wtedy DeAI przestaje być projektem badawczym i zaczyna być infrastrukturą. Obejrzyj 0G.