El objetivo de la teoría/ciencia del aprendizaje profundo es guiar la práctica. Pero la mayoría de las preguntas prácticas están a > un artículo de ser respondidas legítimamente por la teoría. ¿Cómo podemos entonces avanzar sin acceso a la señal de recompensa ideal de "¿esta teoría nos da un algoritmo SOTA"? ...