"Nosso framework de taxa de aprovação também nos dá boas intuições sobre por que o auto-jogo tem sido tão produtivo na história do RL. Se você está competindo contra um jogador que é quase tão bom quanto você, está equilibrando em torno de uma taxa de aprovação de 50%, que supera os bits que você obtém de uma variável binária aleatória."