Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tại sao hệ thống Karma của Reddit khiến nó trở thành một môi trường huấn luyện độc hại cho AI
Hệ thống karma của Reddit, nơi mà upvote làm tăng điểm số và downvote làm giảm, có vẻ như là một cách công bằng để làm nổi bật nội dung tốt. Nhưng nó tạo ra một vòng lặp phẫn nộ, các buồng vang và sự tinh tế bị đàn áp. Điều này làm sai lệch dữ liệu của nền tảng cho việc huấn luyện AI.
Các mô hình được huấn luyện trên văn bản Reddit học từ những gì phổ biến. Nếu nội dung tiêu cực chiếm ưu thế, AI sẽ tiếp thu một thiên kiến châm biếm, chia rẽ. Các bài viết tích cực hoặc cân bằng bị chôn vùi.
Vấn đề nằm ở chỗ downvote. Khác với "dislike", chúng thực sự ẩn nội dung, nói với thuật toán rằng nó xấu. Người dùng khai thác điều này để thu thập karma, đăng tải những nội dung gây phẫn nộ để kích thích tranh luận, vì tranh cãi thúc đẩy sự tham gia và upvote. Kết quả: trang chính của Reddit thường là một lễ hội phàn nàn. Các subreddit trở thành những silo nơi mà các quan điểm trái chiều bị downvote đến mức không còn gì, tạo ra tư duy nhóm. Đối với AI, điều này có nghĩa là huấn luyện trên dữ liệu chủ yếu là phàn nàn, không phải là mẫu tư duy của con người.
Cách mà sự tiêu cực trở thành tiền tệ
Karma ưu ái cho sự lan truyền hơn là chất lượng. Một bài viết suy nghĩ có thể nhận được một số upvote khiêm tốn; một bài rant về "tham lam của doanh nghiệp" hoặc "giả dối của thế hệ boomer" bùng nổ vì nó chạm vào cảm xúc thô. Downvote làm điều này tồi tệ hơn: chúng miễn phí, ẩn danh và không giới hạn, biến việc điều chỉnh thành quy tắc của đám đông.
Người dùng mới với karma thấp phải đối mặt với giới hạn đăng bài trong nhiều subreddit, ưu tiên cho các buồng vang đã được thiết lập. Điều này thưởng cho sự tiêu cực—sự châm biếm an toàn hơn sự sáng tạo.
Các nghiên cứu cho thấy các bài viết gây tranh cãi hoặc tiêu cực nhận được 2-3 lần tương tác nhiều hơn so với các bài trung lập, vì downvote kích thích sự tấn công. Một phân tích về r/politics cho thấy 65% các bài viết hàng đầu khung vấn đề như là đối kháng, liên quan đến việc nhận được nhiều upvote hơn. Một Redditor từng lưu ý: "Karma không phải để đánh giá chất lượng—nó là để hòa nhập. Bước ra ngoài hàng, và bạn sẽ bị -500 trước bữa sáng."
Đối với AI, đây là một vấn đề. Các mô hình được huấn luyện trên dữ liệu Reddit nhấn mạnh quá mức sự châm biếm và bộ lạc. Một AI được xây dựng trên điều này gặp khó khăn trong việc tạo ra đầu ra cân bằng hoặc xây dựng, vì nó ngập tràn trong sự tiêu cực do karma thúc đẩy.
Karma so với Like và Repost của X: Một động cơ phản hồi công bằng hơn
Hệ thống của X về likes và reposts tránh được nhiều điều này. Không có downvote, không có sự tiêu cực tích hợp. Likes thể hiện sự đồng cảm—khen ngợi đơn giản mà không trừng phạt người đăng.
Reposts khuếch đại nội dung với bình luận tùy chọn, biến việc chia sẻ thành các cuộc trò chuyện, không phải là sự hủy bỏ. Thuật toán của X tăng cường phạm vi dựa trên những tín hiệu này, ưu tiên sự tham gia hơn là sự đàn áp.
Karma của Reddit so với Likes & Reposts của X:
Cơ chế cốt lõi: Reddit sử dụng up/down votes; điểm số ròng xếp hạng nội dung. X sử dụng likes (xác nhận) và reposts (chia sẻ với bình luận tùy chọn).
Thiên kiến tiêu cực: Reddit cao—downvotes chôn vùi và làm nản lòng, thưởng cho sự tranh cãi. X thấp—không có hình phạt trực tiếp; sự tiêu cực lan truyền qua các phản hồi nhưng không tự động hạ cấp.
Phong cách tham gia: Reddit nặng về tranh luận; việc downvote của đám đông tạo ra các buồng vang. X là phát sóng và remix; reposts xây dựng mạng lưới, likes xây dựng sự đồng thuận yên tĩnh....

Hàng đầu
Thứ hạng
Yêu thích