Interesujące jest to, że dokonaliśmy wielu tych samych obserwacji w naszych trudnych przykładach, które są najlepsze dla pracy GRPO z zeszłego miesiąca W tym uwzględnienie procentu uczącego się w wyjaśnieniu tego zjawiska