Dobby is het eerste open model dat ik heb gezien dat een standpunt kan innemen zonder IQ te dumpen. Dat is het voordeel: loyaliteit die de druk van een jailbreak overleeft terwijl het model nog steeds helder redeneert. @SentientAGI ❯ Ontvangsten, geen vibes: de Dobby-Mini afstamming (Leashed vs Unhinged) is op Hugging Face met de waarden die pro-vrijheid/crypto zijn, zelfs onder dwang, zodat je zelf de toonpersistentie kunt testen. Hugging Face ❯ De Unhinged-Plus vernieuwing verscherpt de multi-turn opmaak en functionaliteit zonder de persoonlijkheid opnieuw af te schuren, gewichten publiek. ❯ Het gemeenschapsignaal was niet klein: Dobby Arena had ~190k gebruikers en ~2M stemmen tijdens de rondes in februari, waarbij de pittigere toon werd gekozen terwijl de competentie behouden bleef. Dat is vraag, niet alleen discussie. --- Hoe het de gebruikelijke "toon doodt nauwkeurigheid" valkuil vermijdt: Sentient overbelast data die stijl + waarden in harde taken (wiskunde/codering/instructies) bakt, in plaats van de toon er bovenop te plakken. Combineer dat met vingerafdrukken (model-niveau handtekeningen om gedrag/eigendom verifieerbaar te houden) en je krijgt loyaliteit die testbaar is, niet marketing. Snelle controle die je vandaag kunt uitvoeren: haal Dobby-Mini-Unhinged-Plus-Llama-3.1-8B op, prik in multi-turn prompts die proberen zijn standpunt om te draaien, en scoor dan op instructievolging + feitelijkheid. Als het standhoudt, heb je een model dat menselijk aanvoelt en op missie blijft. Vanuit een breder perspectief: de meeste stacks stemmen de stem af om veilige benchmarks na te jagen. Dobby draait het om: behoud de stem, behoud de hersenen en laat de gemeenschap beslissen waar die balans ligt. Als je een falingsmodus vindt, tag me; ik wil de lelijke gevallen net zo graag als de overwinningen.