SWAX: короткие окна, долгая память • Гибрид внимания со скользящим окном + xLSTM RNN • Противоречиво: более короткие окна → лучшее долгосрочное запоминание • Решение: стохастические размеры окон = сильная производительность в краткосрочной и долгосрочной перспективе • Превосходит фиксированное внимание с окном