Документ mHC действительно интересен, и я сейчас провожу некоторые тесты, но, судя по первоначальным испытаниям, кажется очевидным, что это решает проблему, которую почти никто другой не решает (если только вы не обучаете передовые, очень большие, очень глубокие модели с множеством RL). По крайней мере, это мой первоначальный вывод.