Nueva investigación antrópica: filtrando información peligrosa en el preentrenamiento. Estamos experimentando con formas de eliminar información sobre armas químicas, biológicas, radiológicas y nucleares (QBRN) de los datos de entrenamiento de nuestros modelos sin afectar el rendimiento en tareas inofensivas.
224.36K