Et godt eksempel på hvorfor jeg og mange RL-hviskere sier at du må bruke større basismodeller for RL i dag. Bedre forhåndstrening vil gjøre det slik at RL på mindre basismodeller kan løse vanskeligere og mer interessante oppgaver. Dette er måten.