为 repeng 添加了一个新功能,使得训练跨模型的控制向量(或其他奇怪的东西)变得更加容易。 这是 qwen2.5-7b 基础模型 / 针对指令激活进行引导 / 远离指令激活进行引导。你可以非常清楚地看到退火的效果!