x 算法的问题在于,它假设你未来的最佳版本是你过去版本的强化版。