- Pienen erän luonti alkaa muistin kaistanleveydellä sidottuna ja pysyy sellaisena, kun lisäät kontekstin pituutta. - Voit tehdä siitä laskentasidotun (ja osua tensoriytimiin) lisäämällä erän kokoa / rinnakkaisten pyyntöjen määrää. -Mutta kun kontekstin pituus pitenee, se alkaa taas muuttua enemmän kaistanleveyteen sidotuksi. - Ja erän koon mahdollinen määrä on rajallinen muistirajoitusten vuoksi. Vahva argumentti malleille, joiden tila on pienempi. Ne auttavat sinua välttämään muistiseinän jopa eräluomisessa, vaikka kasvatat kontekstia