不錯的工作 - 沒有手工驗證器的探索性強化學習顯然是下一個擴展的明顯選擇