🔒Làm thế nào chúng ta có thể ngăn chặn thiệt hại từ các hệ thống AI theo đuổi các mục tiêu không mong muốn? Kiểm soát AI là một chương trình nghiên cứu đầy hứa hẹn nhằm giải quyết câu hỏi quan trọng này. Hôm nay, chúng tôi rất vui mừng ra mắt ControlArena – thư viện của chúng tôi để thực hiện các thí nghiệm kiểm soát AI an toàn và có thể tái tạo🧵