Interesant este că am făcut multe dintre aceleași observații în exemplele noastre dure care sunt cele mai bune pentru lucrarea GRPO de luna trecută Includerea procentului de învățare în setul de antrenament explică acest fenomen