Nový antropický výzkum: filtrování nebezpečných informací při předtréninku. Experimentujeme se způsoby, jak odstranit informace o chemických, biologických, radiologických a jaderných (CBRN) zbraních z tréninkových dat našich modelů, aniž by to ovlivnilo výkon v neškodných úkolech.
224,36K