До речі. Нещодавно написав статтю з цього приводу! Для трансформаторів це число становить близько 3,6 біт на параметр так що для точного запам'ятовування Вікіпедії вам знадобиться 25 ГБ ÷ 3,6 біта ≈ 56,9 млрд параметрів Насправді це досить велика модель