Nueva investigación de Anthropic: filtrando información peligrosa en el preentrenamiento. Estamos experimentando con formas de eliminar información sobre armas químicas, biológicas, radiológicas y nucleares (CBRN) de los datos de entrenamiento de nuestros modelos sin afectar el rendimiento en tareas inofensivas.
224,38K