Neue Forschung von Anthropic: Herausfiltern gefährlicher Informationen während des Pretrainings. Wir experimentieren mit Möglichkeiten, Informationen über chemische, biologische, radiologische und nukleare (CBRN) Waffen aus den Trainingsdaten unserer Modelle zu entfernen, ohne die Leistung bei harmlosen Aufgaben zu beeinträchtigen.
224,38K