Jag är glad över att vår uppsats "Open Problems in Mechanistic Interpretability" (länk i svaret) blev antagen till TMLR. Vi saknar fortfarande förståelse för hur dagens starkaste AI-system fungerar!