有興趣看看 Loria 將如何與確定性或目標導向的結構進行介面,即獎勵建模