Die Annahme, die heute jeder zu haben scheint, ist, dass die Kosten für Inferenz derzeit stark subventioniert sind und in naher Zukunft dramatisch steigen werden. Ich denke, das ist möglicherweise ein fehlerhaftes mentales Modell, wenn man sich vergangene subventionierte Unternehmen mit extrem hohen Grenzkosten ansieht.
Viele dieser Modelle arbeiten heute nicht einmal auf Basis eines Modell-Einheit mit Verlust (insbesondere wenn man die Trainingskosten als Investitionsausgaben betrachtet, was sie arguably sind). Ich denke, das wahrscheinlichste Ergebnis ist, dass sie pro Token viel günstiger werden und die Anzahl der verbrauchten Tokens exponentiell wächst.
36