Zpětnovazební učení se posunulo od utrácení milionů hrubých kroků k vymačkání hodnoty z každé zkoušky. RoE by @bageldotcom tento posun stlačuje do jedné metriky. Vyšší RoE znamená větší učení na zkušenost, ať už z robotů, jazykových modelů nebo simulátorů.