Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Chińskie laboratorium AI właśnie cicho wydało model, który samodzielnie nauczył się poprawić o 30% 🤯
Zespół @MiniMax_AI dał M2.7 dostęp do własnej infrastruktury szkoleniowej. Własnego procesu uczenia przez wzmocnienie. Własnej pamięci. Następnie kazali mu uczynić się lepszym.
I to zrobił...
M2.7 zbudował dziesiątki złożonych umiejętności w swoim własnym systemie RL. Zaktualizował swoje systemy pamięci. Optymalizował swój proces uczenia przez wzmocnienie na podstawie wyników, które oceniał w czasie rzeczywistym. Prowadził tę pętlę autonomicznie przez ponad 100 rund, analizując trajektorie porażek, modyfikując swój własny kod szkieletowy, przeprowadzając oceny, porównując wyniki i decydując, co zachować lub co cofnąć.
Nie było człowieka w pętli. Tylko model poprawiający model.
Wynik:
- 30% poprawy wydajności w wewnętrznych ocenach
- 66,6% wskaźnik medali w konkursach ML (to łączy go z Gemini 3.1. Wyniki SWE-Pro są prawie równe Claude Opus)
MiniMax już autonomicznie prowadzi 30% całej działalności firmy na swoich własnych modelach. 80% nowo wprowadzonego kodu w firmie jest generowane przez AI. Dosłownie wprowadzają samodoskonalenie jako infrastrukturę organizacyjną, a giełda w Hongkongu to uwielbia.
To są wczesne etapy rekurencyjnego samodoskonalenia. I pochodzi z Szanghaju.



Najlepsze
Ranking
Ulubione
