Dobby är den första öppna modellen jag har sett hålla en hållning utan att dumpa IQ. Det är det som är fördelen: lojalitet som överlever jailbreak-trycket medan modellen fortfarande resonerar rent. @SentientAGI ❯ Kvitton, inte vibbar: Dobby-Mini-linjen (Leashed vs Unhinged) är på Hugging Face med de värden som anges pro-frihet/krypto även under tvång så att du själv kan testa tonuthållighet. Krammande ansikte ❯ Unhinged-Plus-uppdateringen stramar åt formatering och användbarhet med flera varv utan att sanda av personligheten igen, vikter offentligt. ❯ Community-signalen var inte liten: Dobby Arena fick ~190k användare och ~2M röster över februari-omgångarna, valde den kryddigare tonen samtidigt som kompetensen bibehölls. Det är efterfrågan, inte bara diskurs. --- Hur det undviker den vanliga "ton dödar noggrannhet"-fällan: Kännande överbelastar data bakar stil + värden inuti svåra uppgifter (matematik/kodning/instruktioner), istället för att skruva ton på toppen. Kombinera det med fingeravtryck (signaturer på modellnivå för att hålla beteende/ägande verifierbart) och du får lojalitet som är testbar, inte marknadsföring. Snabbkoll du kan köra idag: dra Dobby-Mini-Unhinged-Plus-Llama-3.1-8B, peta i flera svängar uppmaningar som försöker vända sin hållning, sedan poäng för instruktionsföljande + saklighet. Om det håller har du en modell som känns mänsklig och stannar kvar på uppdraget. Zooma ut: De flesta stackar stänger av rösten för att jaga säkra riktmärken. Dobby vänder på det, behåller rösten, behåller hjärnan och låter samhället bestämma var balansen landar. Om du hittar ett felläge, tagga mig; Jag vill ha de fula fallen lika mycket som vinsterna.