el artículo de mHC es realmente interesante y estoy haciendo algunas pruebas ahora, pero parece claro desde las pruebas iniciales que esto resuelve un problema que casi nadie más ha hecho (a menos que estés entrenando Frontier, modelos muy grandes, muy profundos y con mucho RL). Al menos esta es mi primera lectura