我认为我们开始看到一些模型,它们不仅看起来有用 而且实际上能够完成任务。 到目前为止,AI看起来非常有能力,但往往会感到沮丧 我认为通过RLVR进行的RL扩展正在奏效 这让我感觉像90年代初的互联网:缓慢的进展,然后迅速发展,突然之间变得极其有用。