Die Leute denken, dass RL Magie ist, aber RL funktioniert nur, wenn man nahezu unbegrenzte Rechenleistung und ein Leben hat, um vielfältige Proben aus der Umgebung zu sammeln. Menschen lernen offensichtlich unter begrenzter Rechenleistung und begrenztem Probenregime, daher ist es lohnenswert zu lernen, wie wir es tun.