🔒¿Cómo podemos prevenir el daño de los sistemas de IA que persiguen objetivos no deseados? El control de la IA es una agenda de investigación prometedora que busca abordar esta pregunta crítica. Hoy, nos complace lanzar ControlArena, nuestra biblioteca para ejecutar experimentos de control de🧵 IA seguros y reproducibles