Рады сообщить, что наша статья "Открытые проблемы в механистической интерпретируемости" (ссылка в ответе) была принята в TMLR. Мы все еще не понимаем, как работают самые сильные AI-системы сегодня!