Nuova ricerca di Anthropic: filtrare le informazioni pericolose durante il pre-addestramento. Stiamo sperimentando modi per rimuovere informazioni su armi chimiche, biologiche, radiologiche e nucleari (CBRN) dai dati di addestramento dei nostri modelli senza influenzare le prestazioni su compiti innocui.
224,36K