przy okazji. niedawno napisałem na ten temat artykuł! w przypadku transformatorów liczba wynosi około 3,6 bitu na parametr więc potrzebowałbyś 25GB ÷ 3,6 bity ≈ 56,9B parametrów, aby dokładnie zapamiętać Wikipedię to właściwie całkiem duży model