Noen punkter som skilte seg ut i diskusjonen i gangen med @JeffDean om kontinuerlig læring: 1. RL/finjustering med brukerinnstillinger ved utrulling kan være farlig siden vi ikke kan kontrollere agentens oppførsel. 2. Vi trenger nye paradigmer fremover for fortrening for å muliggjøre den agentiske kontinuerlige tilnærmingen. 3. Google ser imidlertid ikke nedgangen i den nåværende loven om skalering før opplæring. Alle punktene ovenfor utelukker ikke hverandre. Vi trenger flere tekniske diskusjoner på bakken enn å overse overskriftene.