Sigmoidien portaat Tutkin lähdettä luettuani kääpiöjutun, joka huolestutti minua melko paljon. Julkaisussa hän mainitsee: "Toby Ordilla on loistava kirjoitus, jossa hän kekseliäästi yhdistää pisteet eri o-sarjan vertailukaavioiden välillä, ja siinä ehdotettiin, että "tarvitsemme jotain 1 000 000-kertaisen kokonais-RL-laskennan skaalauksen saadaksemme GPT-tason kaltaisen lisäyksen." Tämä saa kuulostamaan siltä, että asiat pysähtyvät. Toby menee niin pitkälle, että sanoo kaksi asiaa, jotka huolestuttivat minua: 1. "Olemme nähneet vaikuttavia edistysaskeleita, mutta ne olivat mahdollisia vain, kun aloitettiin näin matalalta pohjalta. Olemme tulleet pisteeseen, jossa on liian kallista mennä pidemmälle." 2. "Nyt kun RL-koulutus lähestyy tehokasta rajaansa, saatamme menettää kyvyn muuttaa enemmän laskentaa älykkäämmäksi." Kysyin, kuinka pätevä tämä väite on ja mikä on vastakkainen argumentti RL:n laajentamiselle. Hyvä ystävä sanoi: "Kyllä, jos jatkat naiivisti skaalaamista RL-laskentaa, se skaalautuu huonosti. Mutta meidän ei pitäisi tehdä niin! Siksi on niin paljon RL-ympäristöyrityksiä. Parempi lähestymistapa on skaalautua uusiin, haastavampiin ympäristöihin. " Pohdittuani asiaa hetken, löysin tavan tiivistää tämä vielä enemmän: "Kuvitella se portaikkona uusille tehtäville, maailmoille, tavoitteille on hyödyllisin tapa miettiä, miten se voi jatkua jonkin aikaa."