Un buon esempio del perché io e molti esperti di RL diciamo che oggi è necessario utilizzare modelli di base più grandi per RL. Un migliore preaddestramento farà sì che RL su modelli di base più piccoli possa risolvere compiti più difficili e interessanti. Questa è la strada.