🔒¿Cómo podemos prevenir daños de los sistemas de IA que persiguen objetivos no intencionados? El control de la IA es una agenda de investigación prometedora que busca abordar esta cuestión crítica. Hoy, estamos emocionados de lanzar ControlArena: nuestra biblioteca para realizar experimentos de control de IA seguros y reproducibles🧵