Ny antropisk forskning: filtrering av farlig informasjon ved fortrening. Vi eksperimenterer med måter å fjerne informasjon om kjemiske, biologiske, radiologiske og kjernefysiske (CBRN) våpen fra modellenes treningsdata uten å påvirke ytelsen til ufarlige oppgaver.
224,38K