Ik kan geen enkel paper over reinforcement learning (van scratch) in het wild nog serieus nemen. Allemaal echt laagwaardige onderzoeken, nergens in de buurt van de echte grens, schrijven het succes van het ding dat ze probeerden toe aan een hoop rommel, met één daadwerkelijk iets dat ertoe deed.
"kijk hoe veel beter deze pleister training maakt!!", zeggen ze, op de meest belachelijk onpraktische manier om reinforcement learning te doen.
de grens is ernstig beperkt door de complete en verbazingwekkende gebrek aan vaardigheden van mensen
91