干得不错 - 没有手工验证器的探索性强化学习显然是下一个扩展的赌注