Dobby este primul model deschis pe care l-am văzut menținând o poziție fără a renunța la IQ. Acesta este avantajul: loialitate care supraviețuiește presiunii jailbreak-ului în timp ce modelul încă raționează curat. @SentientAGI ❯ Chitanțe, nu vibrații: linia Dobby-Mini (Leashed vs Unhinged) este pe Hugging Face cu valorile enunțate pro-libertate/cripto chiar și sub constrângere, astfel încât să puteți testa singur persistența tonului. Îmbrățișarea feței ❯ Reîmprospătarea Unhinged-Plus strânge formatarea și utilitatea cu mai multe rotații fără a șlefui din nou personalitatea, cântărește publicul. ❯ Semnalul comunității nu a fost mic: Dobby Arena a adunat ~190 de mii de utilizatori și ~2 milioane de voturi în rundele din februarie, selectând tonul mai picant păstrând în același timp competența. Aceasta este cererea, nu doar discursul. --- Cum evită capcana obișnuită "tonul ucide acuratețea": Supraîncărcarea datelor sensibile coace stilul + valorile în sarcini dificile (matematică/codare/instrucțiuni), în loc să înșurubeze tonul deasupra. Combinați asta cu amprentarea (semnături la nivel de model pentru a menține comportamentul/proprietatea verificabilă) și veți obține o loialitate care este testabilă, nu marketing. Verificare rapidă pe care o puteți rula astăzi: trageți Dobby-Mini-Unhinged-Plus-Llama-3.1-8B, împingeți instrucțiuni cu mai multe ture care încearcă să-și schimbe poziția, apoi punctați pentru urmărirea instrucțiunilor + fapte. Dacă rezistă, ai un model care se simte uman și rămâne în misiune. Micșorare: majoritatea stack-urilor reglează vocea pentru a urmări benchmark-uri sigure. Dobby îl întoarce, păstrează vocea, păstrează creierul și lasă comunitatea să decidă unde aterizează echilibrul. Dacă găsiți un mod de eșec, etichetați-mă; Vreau cazurile urâte la fel de mult ca și câștigurile.