热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
DLLMs 看起来很有前景……但并行生成并不总是可能的
基于扩散的 LLM 可以同时在不同位置生成多个标记,而大多数自回归 LLM 是一个一个地生成标记。
这使得基于扩散的 LLM 在我们需要快速生成且计算量较少时非常有吸引力。
一个大问题是……在不失去建模准确性的情况下,是否可以进行并行生成?
答案是否定的。我们可以实现的并行性有基本的限制。
考虑这个例子:
“从以下四个城市中均匀随机选择一个城市:
纽约、新奥尔良、墨西哥城或巴拿马城。”
然后,
P(Y₁ = New, Y₂ = York) = 1/4,
P(Y₁ = New, Y₂ = Orleans) = 1/4,等等。
因此,P(Y₁ = New) = 1/2,P(Y₂ = City) = 1/2。
如果你选择并行生成 Y₁ 和 Y₂,无论你使用什么解码算法……
你注定会抽样出“New City”。
今天的 DLLMs 没有一个可以在不放弃并行性的情况下正确生成这两个词。
-----
为什么会这样?...



热门
排行
收藏

