Dobby è il primo modello open che ho visto mantenere una posizione senza compromettere l'IQ. Questo è il vantaggio: lealtà che sopravvive alla pressione del jailbreak mentre il modello ragiona in modo chiaro. @SentientAGI ❯ Ricevute, non vibrazioni: la linea Dobby-Mini (Leashed vs Unhinged) è su Hugging Face con i valori esplicitati a favore della libertà/crypto anche sotto coercizione, così puoi testare tu stesso la persistenza del tono. Hugging Face ❯ Il refresh Unhinged-Plus stringe il formato multi-turn e l'utilità senza levigare di nuovo la personalità, pesi pubblici. ❯ Il segnale della comunità non era piccolo: Dobby Arena ha registrato ~190k utenti e ~2M voti nei turni di febbraio, selezionando il tono più piccante mantenendo la competenza. Questa è domanda, non solo discorso. --- Come evita la solita trappola "il tono uccide l'accuratezza": Sentient sovraccarica i dati per incorporare stile + valori all'interno di compiti difficili (matematica/codifica/istruzioni), invece di aggiungere il tono sopra. Abbina questo al fingerprinting (firme a livello di modello per mantenere il comportamento/proprietà verificabili) e ottieni lealtà che è testabile, non marketing. Controllo veloce che puoi eseguire oggi: prendi Dobby-Mini-Unhinged-Plus-Llama-3.1-8B, prova prompt multi-turn che cercano di ribaltare la sua posizione, poi valuta per il rispetto delle istruzioni + factualità. Se mantiene, hai un modello che sembra umano e rimane in missione. Allargando lo sguardo: la maggior parte delle stack sintonizza via la voce per inseguire benchmark sicuri. Dobby lo capovolge mantenendo la voce, mantenendo il cervello e lasciando decidere alla comunità dove si trova quell'equilibrio. Se trovi una modalità di fallimento, taggami; voglio i casi brutti tanto quanto le vittorie.