apropo. Recent a scris o lucrare despre asta! Pentru transformatoare, numărul este de aproximativ 3,6 biți pe parametru deci ai avea nevoie de 25 GB ÷ 3,6 biți ≈ 56,9 miliarde de parametri pentru a memora exact Wikipedia Acesta este un model destul de mare de fapt