Mimochodem. Nedávno jsem o tom napsal článek! U transformátorů je toto číslo přibližně 3,6 bitů na parametr takže byste potřebovali 25 GB ÷ 3,6 bitů ≈ 56,9B parametry, abyste si přesně zapamatovali Wikipedii to je vlastně docela velký model