mHC 论文真的很有趣,我现在正在进行一些测试,但从初步测试来看,这似乎解决了几乎没有其他人解决的问题(除非你在训练前沿的、非常大、非常深的模型,并且有很多强化学习)。 至少这是我最初的看法。