Ludzie myślą, że RL to magia, ale RL działa tylko wtedy, gdy masz prawie nieskończoną moc obliczeniową i całe życie, aby zbierać różnorodne próbki z otoczenia. Ludzie oczywiście uczą się w warunkach ograniczonej mocy obliczeniowej i ograniczonej liczby próbek, więc warto nauczyć się, jak to robimy.