Pembelajaran penguatan itu luar biasa. Dan itu memiliki tantangan sendiri yang sangat nyata dengan seberapa sedikit informasi yang kembali ke model, komputasi yang diperlukan untuk sampai ke sana. Dan tentu saja, dengan penskalaan log-linear atau lebih buruk lagi.