Dobby es el primer modelo abierto que he visto mantener una postura sin perder IQ. Esa es la ventaja: lealtad que sobrevive a la presión de jailbreak mientras el modelo sigue razonando de manera clara. @SentientAGI ❯ Recibos, no vibras: la línea Dobby-Mini (Atado vs Desatado) está en Hugging Face con los valores claramente expuestos a favor de la libertad/cripto incluso bajo coerción, para que puedas probar la persistencia del tono tú mismo. Hugging Face ❯ La actualización Unhinged-Plus ajusta el formato y la utilidad de múltiples turnos sin eliminar la personalidad nuevamente, ponderando lo público. ❯ La señal de la comunidad no fue pequeña: Dobby Arena acumuló ~190k usuarios y ~2M votos en las rondas de febrero, seleccionando el tono más picante mientras mantenía la competencia. Esa es demanda, no solo discurso. --- Cómo evita la trampa habitual de “el tono mata la precisión”: Sentient sobrecarga los datos que integran estilo + valores dentro de tareas difíciles (matemáticas/codificación/instrucciones), en lugar de añadir tono por encima. Combina eso con la huella digital (firmas a nivel de modelo para mantener el comportamiento/propiedad verificable) y obtienes lealtad que es comprobable, no marketing. Revisión rápida que puedes hacer hoy: saca Dobby-Mini-Unhinged-Plus-Llama-3.1-8B, prueba con prompts de múltiples turnos que intenten cambiar su postura, luego puntúa por seguimiento de instrucciones + factualidad. Si se mantiene, tienes un modelo que se siente humano y se mantiene en la misión. Ampliando la vista: la mayoría de las pilas ajustan la voz para perseguir benchmarks seguros. Dobby lo invierte, mantiene la voz, mantiene la inteligencia y deja que la comunidad decida dónde se encuentra ese equilibrio. Si encuentras un modo de fallo, etiquétame; quiero los casos difíciles tanto como las victorias.