Loriaが決定論的または目標志向の構造、つまり報酬モデリングとどのように連携するかを見るのが楽しみです