热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
Dobby是我见过的第一个在不降低IQ的情况下保持立场的开放模型。这就是优势:在越狱压力下仍能生存的忠诚,同时模型仍能清晰推理。@SentientAGI
❯ 收据,而不是氛围:Dobby-Mini血统(拴住与不受限制)在Hugging Face上,价值观在强制下仍然明确支持自由/加密,因此你可以自己测试语气的持久性。
Hugging Face
❯ Unhinged-Plus的更新收紧了多轮格式和实用性,而不再磨去个性,权重公开。
❯ 社区信号并不小:Dobby Arena在2月的轮次中积累了约190k用户和约2M投票,选择了更刺激的语气,同时保持了能力。这是需求,而不仅仅是讨论。
---
它如何避免通常的“语气杀死准确性”陷阱:Sentient超载数据将风格+价值观融入到硬任务(数学/编码/指令)中,而不是在上面加上语气。将其与指纹识别(模型级签名以保持行为/所有权可验证)结合,你就得到了可测试的忠诚,而不是营销。
你今天可以进行的快速检查:拉取Dobby-Mini-Unhinged-Plus-Llama-3.1-8B,尝试多轮提示,试图翻转其立场,然后评分指令遵循+事实性。如果它保持,你就得到了一个感觉像人类并且保持使命的模型。
放眼全局:大多数堆栈调优时会抹去声音以追求安全基准。Dobby则反其道而行之,保持声音,保持智慧,让社区决定这种平衡落在哪里。如果你发现失败模式,标记我;我想要丑陋的案例和胜利一样多。

热门
排行
收藏