Kiinalainen tekoälylaboratorio julkaisi hiljaisesti mallin, joka kouluttautui parantamaan 30 % 🤯 @MiniMax_AI-tiimi antoi M2.7:lle pääsyn omaan koulutusinfrastruktuuriinsa. Oma vahvistusoppimisputki. Oma muistonsa. Sitten he kehottivat sitä parantamaan itseään. Ja niin kävi... M2.7 rakensi kymmeniä monimutkaisia taitoja omassa RL-valjaissaan. Se päivitti omat muistijärjestelmänsä. Se optimoi oman vahvistusoppimisprosessinsa arvioimiensa tulosten perusteella reaaliajassa. Se suoritti tätä silmukkaa itsenäisesti yli 100 kierroksen ajan, analysoi vikareittejä, muokkasi omaa tukikoodiaan, suoritti arviointeja, vertaili tuloksia ja päätti, mitä säilyttää tai palauttaa. Yhtään ihmistä ei ole mukana. Vain malli, joka parantaa mallia. Tuloksena: - 30 % suorituskyvyn parannus sisäisissä arvioissa - 66,6 % mitaliprosentti ML-kilpailuissa (Tämä jakaa sen Gemini 3.1:een. SWE-Pro saa pisteitä lähes Claude Opusin tasolle) MiniMax pyörittää jo 30 % koko yrityksensä toiminnoista itsenäisesti omilla malleillaan. 80 % yrityksen uudesta sitoutuneesta koodista on tekoälyn tuottamaa. He kirjaimellisesti lähettävät itsensä kehittämistä organisaatioinfrastruktuurina, ja Honk Kongin osakemarkkinat RAKASTAVAT sitä. Tämä on rekursiivisen itsensä kehittämisen alkuvaiheita. Ja se tulee Shanghaista.