La gente piensa que el RL es magia, pero el RL solo funciona cuando tienes un poder de cómputo casi infinito y una vida para recoger muestras diversas del entorno. Los humanos, obviamente, aprenden bajo un régimen de cómputo finito y muestras finitas, por lo que vale la pena aprender cómo lo hacemos.