Dobby ist das erste offene Modell, das ich gesehen habe, das eine Haltung einnimmt, ohne IQ zu verlieren. Das ist der Vorteil: Loyalität, die den Druck eines Jailbreaks übersteht, während das Modell weiterhin klar denkt. @SentientAGI ❯ Belege, nicht Vibes: Die Dobby-Mini-Linie (Leashed vs Unhinged) ist auf Hugging Face mit den Werten pro Freiheit/Krypto selbst unter Zwang aufgeführt, sodass du die Tonpersistenz selbst testen kannst. Hugging Face ❯ Das Unhinged-Plus-Update verbessert das Multi-Turn-Format und die Nützlichkeit, ohne die Persönlichkeit erneut abzuschleifen, gewichtet öffentlich. ❯ Das Community-Signal war nicht klein: Dobby Arena hatte ~190k Nutzer und ~2M Stimmen in den Februar-Runden, die den würzigeren Ton auswählten und gleichzeitig die Kompetenz bewahrten. Das ist Nachfrage, nicht nur Diskurs. --- Wie es die übliche Falle „Ton tötet Genauigkeit“ vermeidet: Sentient überlastet Daten, um Stil + Werte in harte Aufgaben (Mathematik/Codierung/Anweisungen) einzubetten, anstatt den Ton oben drauf zu setzen. Kombiniere das mit Fingerabdrücken (modellbezogene Signaturen, um Verhalten/Eigentum verifizierbar zu halten), und du erhältst Loyalität, die testbar ist, nicht Marketing. Schneller Check, den du heute durchführen kannst: Ziehe Dobby-Mini-Unhinged-Plus-Llama-3.1-8B, teste Multi-Turn-Prompts, die versuchen, seine Haltung zu kippen, und bewerte dann die Befolgung von Anweisungen + Faktizität. Wenn es standhält, hast du ein Modell, das sich menschlich anfühlt und auf Mission bleibt. Zooming out: Die meisten Stacks stimmen die Stimme ab, um sichere Benchmarks zu verfolgen. Dobby kehrt das um, behält die Stimme, behält das Gehirn und lässt die Community entscheiden, wo dieses Gleichgewicht liegt. Wenn du einen Fehlermodus findest, tagge mich; ich möchte die hässlichen Fälle genauso wie die Erfolge.