Ender, ce n'était pas un environnement RL avec une récompense vérifiable, ce sont de vraies commandes Amazon que tu as passées.
82,14K