Versterkend leren is overgestapt van het besteden van miljoenen ruwe stappen naar het halen van waarde uit elke proef. RoE van @bageldotcom comprimeert deze verschuiving in één metric. Hogere RoE betekent meer leren per ervaring, of het nu gaat om robots, taalmodellen of simulators.