1/ Новий папір — *час тренувального порядку лінійно закодовано в активаціях LLM*! Ми послідовно налаштували модель на 6 наборах даних з розрізненими сутностями. Активації avg з 6 відповідних тестових наборів шикуються в точному порядку тренувань! І лінії для тренувальних прогонів diff ~паралельні!