別の強化学習チームは私たちのPhysical Atariの作業を再現し、私のベースラインエージェントをいくつかの標準的なアルゴリズムと比較しました。