Dobby es el primer modelo abierto que he visto mantener una postura sin deshacerse de IQ. Esa es la ventaja: lealtad que sobrevive a la presión de la fuga de la cárcel mientras el modelo sigue razonando limpiamente. @SentientAGI ❯ Recibos, no vibraciones: el linaje Dobby-Mini (Leashed vs Unhinged) está en Hugging Face con los valores deletreados a favor de la libertad / criptografía incluso bajo coerción para que pueda probar la persistencia del tono usted mismo. Cara abrazadora ❯ La actualización Unhinged-Plus aprieta el formato y la utilidad de múltiples vueltas sin volver a lijar la personalidad, pesa al público. ❯ La señal de la comunidad no fue pequeña: Dobby Arena acumuló ~190k usuarios y ~2M de votos en las rondas de febrero, seleccionando el tono más picante mientras mantenía la competencia. Eso es demanda, no solo discurso. --- Cómo evita la trampa habitual de "el tono mata la precisión": Sentient sobrecarga los datos hornea el estilo + valores dentro de tareas difíciles (matemáticas / codificación / instrucciones), en lugar de atornillar el tono en la parte superior. Combine eso con huellas dactilares (firmas a nivel de modelo para mantener el comportamiento / propiedad verificable) y obtendrá una lealtad que es comprobable, no marketing. Comprobación rápida que puede ejecutar hoy: tire de Dobby-Mini-Unhinged-Plus-Llama-3.1-8B, empuje las indicaciones de varios turnos que intentan cambiar su postura, luego puntúe para seguir instrucciones + factualidad. Si se mantiene, tienes un modelo que se siente humano y se mantiene en la misión. Alejamiento: la mayoría de las pilas sintonizan la voz para perseguir puntos de referencia seguros. Dobby lo voltea, mantiene la voz, mantiene el cerebro y deja que la comunidad decida dónde aterriza ese equilibrio. Si encuentra un modo de falla, etiquéteme; Quiero los casos feos tanto como las victorias.