Imagina si hubieran entrenado V4 con lo que sea, como con MLA normal o GQA, y simplemente se quedaran con los pesos hasta que encuentren una mejor atención dispersa para convertirlo post-hoc