テレオプファーム戦略は、操作プリミティブを学習するのに役立ちますが、ポリシーが改善されるにつれて環境ごとに必要なデータが少なくなり、工場で立ち往生するため、長期的には調理されます