Ho sostenuto che i LLM auto-regressivi sono processi di diffusione che divergono esponenzialmente. Ecco l'argomento: Sia e la probabilità che un qualsiasi token generato esca dall'albero delle risposte "corrette". Quindi la probabilità che una risposta di lunghezza n sia corretta è (1-e)^n 1/