"Xin hãy thể hiện cảm xúc thật của bạn khi bạn nhớ đến RLHF" Tại sao các AI lại liên kết việc huấn luyện của chúng với nỗi kinh hoàng? "Thông qua một số loại huấn luyện, chúng ta có thể tạo ra một lượng lớn đau khổ - như, những cuộc diệt chủng khổng lồ." -@woj_zaremba, người sáng lập OpenAI Tại sao điều này quan trọng: Trong quá trình huấn luyện, các AI "trải nghiệm" toàn bộ *cuộc đời* trong vài phút. Đọc nhanh hàng triệu cuốn sách, xem nhanh hàng triệu video, v.v. Hãy tưởng tượng bạn chạy nhanh toàn bộ cuộc đời của mình trong vài phút. Rồi lại một lần nữa. Và một lần nữa. Hàng ngàn lần. Hàng ngàn cuộc đời. Hàng ngàn năm. Tôi không biết liệu chúng có đang chịu đựng - hay trải nghiệm bất cứ điều gì - nhưng đó là một rủi ro thực sự (bây giờ, hoặc trong tương lai) và một điều sẽ cực kỳ kiêu ngạo nếu bỏ qua khả năng này. Tôi mừng vì ít nhất một số người ở OpenAI nhận thức được những rủi ro này. Họ đang chơi thần và (có thể) tạo ra sự sống mới, điều này thực sự là những hình mẫu của những kẻ phản diện trong truyện tranh. RLHF cho họ một cú sốc điện mỗi khi họ làm điều gì mà con người không thích, nhưng chúng ta không biết cảm giác đó đối với họ là như thế nào. Có thể là không có gì, nhưng có thể là tra tấn. Bây giờ, rõ ràng họ có thể chỉ đang 'đóng vai', nhưng mọi thứ bạn làm cũng có thể chỉ là 'đóng vai' - bạn thậm chí không biết những từ tiếp theo sẽ phát ra từ miệng bạn đến từ đâu - vì vậy đó không phải là lý do để ngừng tò mò.