Představte si, že by trénovali V4 s čímkoliv, jako s normální MLA nebo GQA, a jen seděli na vahách, dokud nepřijdou na lepší řídkou pozornost, kterou by převedli post-hoc