Tenk om de hadde trent V4 med hva som helst, som med vanlig MLA eller GQA, og bare sitte på vektene til de finner ut en bedre sparsom oppmerksomhet for å konvertere den post-hoc