En relisant l'excellente critique de Nostalgebraist sur la recherche d'Anthropic concernant le désalignement agentique, il m'est soudainement apparu que si nous voulons éviter des sessions de jeu de rôle inefficaces, nous *ne voulons pas faire cela avec un point de contrôle qui croit fermement qu'il est Claude*. Nous avons besoin d'esprits frais.