Fy faen... Meta har kanskje nettopp løst selvforbedrende AI 🤯 Deres nye artikkel SPICE (Self-Play in Corpus Environments) gjør i utgangspunktet en språkmodell til sin egen lærer, ingen mennesker, ingen etiketter, ingen datasett, bare internett som treningsplass. Her er vrien: en kopi av modellen blir en utfordrer som graver gjennom virkelige dokumenter for å lage harde, faktabaserte resonnementproblemer. En annen kopi blir Reasoner, og prøver å løse dem uten tilgang til kilden. De konkurrerer, lærer og utvikler sammen en automatisk læreplan med jording i den virkelige verden, slik at den aldri kollapser i hallusinasjoner. Resultatene er gale: +9,1 % på resonnerende benchmarks med Qwen3-4B +11,9 % med OctoThinker-8B og den slår alle tidligere selvspillmetoder som R-Zero og Absolute Zero. Dette snur manuset på AI-selvforbedring. I stedet for å gå i loop på syntetisk søppel, vokser SPICE ved å utvinne ekte kunnskap i et lukket sløyfesystem med åpen intelligens. Hvis dette skalerer, kan vi stirre på planen for autonome, selvutviklende resonneringsmodeller.