Zaskakująca argumentacja z perspektywy teorii perspektywy (ekonomia, Kahneman i Tversky) dotycząca GRPO itp. jako straty percepcyjnej, a zatem możliwe jest stworzenie w pełni offline'owej wersji bez spadku wskaźnika wygranych... poprzez synchronizację z polityką odniesienia na każdym kroku.