Eu afirmei que os LLMs auto-regressivos são processos de difusão exponencialmente divergentes. Aqui está o argumento: Seja e a probabilidade de que qualquer token gerado saia da árvore de respostas "corretas". Então a probabilidade de que uma resposta de comprimento n esteja correta é (1-e)^n 1/