Новое исследование Anthropic: фильтрация опасной информации на этапе предварительного обучения. Мы экспериментируем с методами удаления информации о химическом, биологическом, радиологическом и ядерном (ХБРЯ) оружии из данных для обучения наших моделей, не влияя на производительность в безвредных задачах.
224,36K