🔒我们如何防止追求意外目标的AI系统造成伤害? AI控制是一个有前景的研究议程,旨在解决这个关键问题。 今天,我们很高兴推出ControlArena——我们的安全和可重复的AI控制实验库🧵