🚨 VAROITUS: DeepSeek julkaisi juuri perustavanlaatuisen parannuksen Transformer-arkkitehtuurissa Toimitusjohtaja Wenfeng Liang kirjoittajalistalla VALAS ON PALANNUT 🐋
Artikkeli "mHC: Manifold-Constrained Hyper-Connections" ehdottaa viitekehystä hyperyhteyksien parantamiseksi muuntajissa. Se käyttää monistöprojektioita identiteetin kartoittamisen palauttamiseen, harjoitusten epävakauden, skaalautuvuusrajojen ja muistin ylikuormituksen ratkaisemiseen. Keskeisiä hyötyjä ovat parantunut suorituskyky ja tehokkuus suurissa malleissa, kuten kokeissa on nähty.
90