Uczenie przez wzmacnianie przeszło od wydawania milionów surowych kroków do wyciskania wartości z każdej próby. RoE od @bageldotcom kompresuje tę zmianę w jedną metrykę. Wyższe RoE oznacza większą naukę na doświadczenie, niezależnie od tego, czy pochodzi z robotów, modeli językowych, czy symulatorów.