Nghiên cứu mới của Anthropic: lọc bỏ thông tin nguy hiểm trong quá trình huấn luyện. Chúng tôi đang thử nghiệm các cách để loại bỏ thông tin về vũ khí hóa học, sinh học, phóng xạ và hạt nhân (CBRN) khỏi dữ liệu huấn luyện của các mô hình mà không ảnh hưởng đến hiệu suất trong các nhiệm vụ vô hại.
227,59K