¿Cómo funciona la Atención Escasa (DSA) de @deepseek_ai? Tiene 2 componentes: el Indexador Lightning y la Atención Multi-Latente Escasa (MLA). El indexador mantiene una pequeña caché de claves de 128 por token (frente a 512 para MLA). Evalúa las consultas entrantes. Los 2048 mejores tokens se pasan a la MLA Escasa.