El objetivo de la teoría/ciencia del aprendizaje profundo es guiar la práctica. Pero la mayoría de las preguntas prácticas están a más de 1 artículo de distancia de ser legítimamente respondidas por la teoría. ¿Cómo, entonces, podemos avanzar, sin acceso a la señal de recompensa ideal de "¿nos da esta teoría un algoritmo SOTA?" …