Vahvistusoppiminen on siirtynyt miljoonien raakojen askelten käyttämisestä arvon puristamiseen jokaisesta kokeilusta. RoE by @bageldotcom tiivistää tämän muutoksen yhdeksi mittariksi. Korkeampi oman pääoman tuotto tarkoittaa suurempaa oppimista kokemusta kohden, olipa kyse sitten roboteista, kielimalleista tai simulaattoreista.