Învățarea prin întărire a trecut de la cheltuirea a milioane de pași bruti la stoarcerea valorii fiecărei încercări. RoE de @bageldotcom comprimă această schimbare într-o singură măsură. Un ROE mai mare înseamnă o învățare mai mare pe experiență, fie de la roboți, modele lingvistice sau simulatoare.