Nouvelle recherche d'Anthropic : filtrer les informations dangereuses lors de l'entraînement. Nous expérimentons des moyens pour supprimer les informations sur les armes chimiques, biologiques, radiologiques et nucléaires (CBRN) des données d'entraînement de nos modèles sans affecter les performances sur des tâches inoffensives.
224,37K