est-il possible de préformer un modèle de langage en utilisant uniquement l'apprentissage par renforcement depuis le début ? poids aléatoires, pas de préformation par perte d'entropie croisée. vous avez peut-être beaucoup de questions en tête.
119,55K