se puoi creare un benchmark per qualcosa, probabilmente puoi fare RL. Se no, probabilmente non puoi.