Folk tror RL er magi, men RL fungerer bare når du har nesten uendelig databehandling og et helt liv til å samle inn forskjellige prøver fra miljøet. Mennesker lærer åpenbart under endelig beregning og endelig prøveregime, så det er verdt å lære hvordan vi gjør det.