HC folosește proiecții kronecker factorizate down & up, dar are nevoie de o operație de amestecare H^res. mHC necesită strategic ca H^res să fie matrice dublu stocastice, ceea ce este o închidere față de matmul. (poate funcționează și ortogonală) LatentMoE folosește matrici complete pentru proiecții descendente și ascendente.