Medgründerne av @flappyairplanes kaller dagens RL-paradigme for modelltrening «miljøslopp». De forklarer: "Forsterkningsparadigmene i dag er sjokkerende ineffektive. Du får egentlig ikke så mye generalisering på tvers av oppgaver, du lærer en modell gjennom én type læring og lærer den den neste. Det er litt som whack-a-mole. Vi ser på dette og synes det er litt sprøtt. Det neste paradigmet for AI vil ikke være miljørot.» "Menneskelig intelligens er ikke taket, det er bare gulvet for hva som er mulig. Hvis du kan trene modeller med langt mindre data og muligens mer beregning på veldig forskjellige måter, hva vil da skje? Vi vet faktisk ikke. Men jeg tror de vil være annerledes og rare, og de vil ha interessante egenskaper som vi vil finne veldig verdifulle måter å bruke på."