Forsterkende læring har gått fra å bruke millioner av rå trinn til å presse verdi fra hver prøve. RoE av @bageldotcom komprimerer dette skiftet til én beregning. Høyere RoE betyr større læring per opplevelse, enten det er fra roboter, språkmodeller eller simulatorer.