Dobby là mô hình mở đầu tiên mà tôi thấy giữ được lập trường mà không làm giảm IQ. Đó là lợi thế: lòng trung thành tồn tại dưới áp lực jailbreak trong khi mô hình vẫn lý luận một cách rõ ràng. @SentientAGI ❯ Biên lai, không phải cảm xúc: dòng dõi Dobby-Mini (Leashed vs Unhinged) có trên Hugging Face với các giá trị được nêu rõ ủng hộ tự do/crypto ngay cả dưới sự cưỡng chế để bạn có thể tự kiểm tra độ bền của giọng điệu. Hugging Face ❯ Cập nhật Unhinged-Plus siết chặt định dạng đa lượt và tiện ích mà không làm mất đi tính cách một lần nữa, trọng số công khai. ❯ Tín hiệu từ cộng đồng không hề nhỏ: Dobby Arena đã thu hút ~190k người dùng và ~2M phiếu bầu trong các vòng tháng 2, chọn giọng điệu hấp dẫn hơn trong khi vẫn giữ được năng lực. Đó là nhu cầu, không chỉ là cuộc thảo luận. --- Cách nó tránh bẫy “giọng điệu giết chết độ chính xác” thông thường: Sentient quá tải dữ liệu nướng phong cách + giá trị bên trong các nhiệm vụ khó (toán học/lập trình/hướng dẫn), thay vì gắn giọng điệu lên trên. Kết hợp điều đó với việc nhận dạng dấu vân tay (chữ ký cấp mô hình để giữ cho hành vi/sở hữu có thể xác minh) và bạn có lòng trung thành có thể kiểm tra, không phải tiếp thị. Kiểm tra nhanh mà bạn có thể thực hiện hôm nay: kéo Dobby-Mini-Unhinged-Plus-Llama-3.1-8B, thử các lời nhắc đa lượt cố gắng lật ngược lập trường của nó, sau đó chấm điểm cho việc tuân theo hướng dẫn + độ chính xác. Nếu nó giữ vững, bạn đã có một mô hình cảm thấy như con người và giữ đúng nhiệm vụ. Nhìn tổng thể: hầu hết các stack điều chỉnh giọng nói để theo đuổi các tiêu chuẩn an toàn. Dobby đảo ngược điều đó, giữ giọng nói, giữ trí não và để cộng đồng quyết định nơi cân bằng đó nằm. Nếu bạn tìm thấy một chế độ thất bại, hãy gắn thẻ tôi; tôi muốn những trường hợp xấu xí cũng như những chiến thắng.