Hyvä esimerkki siitä, miksi minä ja monet RL-kuiskaukset sanomme, että RL:ään on käytettävä isompia perusmalleja nykyään. Parempi esikoulutus tekee siitä sen, että RL pienemmillä perusmalleilla voi ratkaista vaikeampia ja mielenkiintoisempia tehtäviä. Tämä on se tapa.