人們認為強化學習是魔法,但強化學習只有在你擁有近乎無限的計算能力和一生的時間來從環境中收集多樣的樣本時才有效。 人類顯然是在有限的計算和有限的樣本範疇下學習的,因此了解我們是如何做到這一點是值得的。