Målet med djupinlärningsteori/vetenskap är att vägleda praktiken. Men de flesta praktiska frågor är > en artikel från att legitimt besvaras av teori. Hur kan vi då göra framsteg utan tillgång till den ideala belöningssignalen "ger denna teori oss en SOTA-algoritm?" ...