Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Fy faen... Meta har kanskje nettopp løst selvforbedrende AI 🤯
Deres nye artikkel SPICE (Self-Play in Corpus Environments) gjør i utgangspunktet en språkmodell til sin egen lærer, ingen mennesker, ingen etiketter, ingen datasett, bare internett som treningsplass.
Her er vrien: en kopi av modellen blir en utfordrer som graver gjennom virkelige dokumenter for å lage harde, faktabaserte resonnementproblemer. En annen kopi blir Reasoner, og prøver å løse dem uten tilgang til kilden.
De konkurrerer, lærer og utvikler sammen en automatisk læreplan med jording i den virkelige verden, slik at den aldri kollapser i hallusinasjoner.
Resultatene er gale:
+9,1 % på resonnerende benchmarks med Qwen3-4B
+11,9 % med OctoThinker-8B
og den slår alle tidligere selvspillmetoder som R-Zero og Absolute Zero.
Dette snur manuset på AI-selvforbedring.
I stedet for å gå i loop på syntetisk søppel, vokser SPICE ved å utvinne ekte kunnskap i et lukket sløyfesystem med åpen intelligens.
Hvis dette skalerer, kan vi stirre på planen for autonome, selvutviklende resonneringsmodeller.

Topp
Rangering
Favoritter

