Am reușit să reproducem concluziile puternice ale lucrării HRM despre ARC-AGI-1. Mai mult, am efectuat o serie de experimente de ablație pentru a ajunge la fundul a ceea ce se află în spatele ei. Constatări cheie: 1. Arhitectura modelului HRM în sine (piesa centrală a lucrării) nu este un factor important. 2. Bucla exterioară de rafinament (abia menționată în lucrare) este principalul factor de performanță. 3. Învățarea prin transfer între sarcini nu este foarte utilă. Ceea ce contează este instruirea cu privire la sarcinile pe care le veți testa. 4. Puteți utiliza mult mai puține augmentări de date, mai ales în timpul inferenței. Constatarea 2 și 3 înseamnă că această abordare este un caz de *antrenament de testare fără preantrenament*, similar cu lucrarea recent publicată "ARC-AGI fără pretraining" de Liao et al.
332,56K