La gente pensa che il RL sia magia, ma il RL funziona solo quando hai un calcolo quasi infinito e una vita per raccogliere campioni diversi dall'ambiente. Gli esseri umani ovviamente apprendono sotto un regime di calcolo finito e campioni finiti, quindi è utile imparare come lo facciamo.