¿Cómo funciona @deepseek_ai atención dispersa (DSA)? Tiene 2 componentes: el Lightning Indexer y la Atención Multilatente Dispersa (MLA). El indexador mantiene una pequeña caché de claves de 128 por token (frente a 512 para MLA). Puntúa las consultas entrantes. Los 2048 tokens principales que pasarán a Sparse MLA.