视频生成模型是优秀的潜在奖励模型