🔒Come possiamo prevenire danni da sistemi AI che perseguono obiettivi non intenzionali? Il controllo dell'AI è un'agenda di ricerca promettente che cerca di affrontare questa questione critica. Oggi siamo entusiasti di lanciare ControlArena – la nostra libreria per eseguire esperimenti di controllo dell'AI sicuri e riproducibili🧵