SWAX: ventanas cortas, memoria larga • Híbrido de atención de ventana deslizante + xLSTM RNN • Contrario a la intuición: ventanas más cortas → mejor recuerdo a largo plazo • Solución: tamaños de ventana estocásticos = fuerte rendimiento en contexto corto y largo • Supera la atención de ventana fija