SWAX: krótkie okna, długa pamięć • Hybryda uwagi z przesuwanym oknem + xLSTM RNN • Przeciwintuicyjne: krótsze okna → lepsza pamięć długoterminowa • Rozwiązanie: stochastyczne rozmiary okien = silna wydajność w krótkim i długim kontekście • Przewyższa uwagę z ustalonym oknem