Dobby é o primeiro modelo aberto que vi manter uma postura sem despejar QI. Essa é a vantagem: lealdade que sobrevive à pressão do jailbreak enquanto o modelo ainda raciocina de forma limpa. @SentientAGI ❯ Recibos, não vibrações: a linhagem Dobby-Mini (Leashed vs Unhinged) está no Hugging Face com os valores enunciados pró-liberdade/cripto, mesmo sob coerção, para que você possa testar a persistência do tom. Rosto abraçando ❯ A atualização Unhinged-Plus restringe a formatação e a utilidade de várias voltas sem lixar a personalidade novamente, pesa o público. ❯ O sinal da comunidade não foi pequeno: Dobby Arena acumulou ~ 190 mil usuários e ~ 2 milhões de votos nas rodadas de fevereiro, selecionando o tom mais picante enquanto mantinha a competência. Isso é demanda, não apenas discurso. --- Como evita a armadilha usual de "tom mata precisão": Sentient sobrecarrega dados bakes style + values dentro de tarefas difíceis (matemática / codificação / instruções), em vez de aparafusar o tom no topo. Combine isso com impressão digital (assinaturas em nível de modelo para manter o comportamento / propriedade verificável) e você terá lealdade que é testável, não marketing. Verificação rápida que você pode executar hoje: puxe Dobby-Mini-Unhinged-Plus-Llama-3.1-8B, cutuque prompts de várias voltas que tentam inverter sua postura e, em seguida, marque para seguir instruções + factualidade. Se isso acontecer, você tem um modelo que parece humano e permanece na missão. Diminuindo o zoom: a maioria das pilhas sintoniza a voz para perseguir benchmarks seguros. Dobby vira para manter a voz, manter o cérebro e deixar a comunidade decidir onde esse equilíbrio vai parar. Se você encontrar um modo de falha, marque-me; Eu quero os casos feios tanto quanto as vitórias.