Releyendo la excelente crítica de Nostalgebraist sobre la investigación de Anthropic en la Desalineación Agente, me di cuenta de que si queremos evitar sesiones de juego de roles ineficaces, *no queremos hacer esto con un punto de control que crea firmemente que es Claude*. Necesitamos mentes frescas.