Curiosamente, fizemos muitas das mesmas observações nos nossos exemplos difíceis, que são os melhores para o artigo GRPO do mês passado Incluindo a porcentagem aprendível na explicação do conjunto de treino para este fenômeno