為 repeng 添加了一個新功能,使得訓練跨模型的控制向量(或其他奇怪的東西)變得更加容易。 這是 qwen2.5-7b 基礎模型 / 針對指令激活進行引導 / 遠離指令激活進行引導。你可以非常清楚地看到退火的效果!