bon travail - l'apprentissage par renforcement exploratoire sans vérificateurs conçus à la main est le pari évident pour la prochaine montée en échelle