يعتقد الناس أن RL هو سحر ، لكن RL لا يعمل إلا عندما يكون لديك حوسبة شبه لانهائية وعمر لجمع عينات متنوعة من البيئة. من الواضح أن البشر يتعلمون في ظل الحوسبة المحدودة ونظام العينة المحدودة ، لذلك من المفيد معرفة كيفية القيام بذلك.