1/ Архитектуры моделей в основном рассматривались как фиксированные после обучения. 🌱 Представляем прививку: новый способ редактирования предварительно обученных диффузионных трансформаторов, позволяющий нам настраивать архитектурные проекты при небольшом вычислительном бюджете. 🌎 Совместно с @MichaelPoli6
29,27K