Penelitian Antropik Baru: menyaring informasi berbahaya pada prapelatihan. Kami sedang bereksperimen dengan cara untuk menghapus informasi tentang senjata kimia, biologi, radiologi, dan nuklir (CBRN) dari data pelatihan model kami tanpa memengaruhi kinerja pada tugas yang tidak berbahaya.
224,37K