Ich habe behauptet, dass auto-regressive LLMs exponentiell divergierende Diffusionsprozesse sind. Hier ist das Argument: Sei e die Wahrscheinlichkeit, dass ein generiertes Token den Baum der "korrekten" Antworten verlässt. Dann ist die Wahrscheinlichkeit, dass eine Antwort der Länge n korrekt ist, (1-e)^n 1/