연구진은 언어 모델의 능력을 효과적으로 이끌어내고 특정 행동을 유도하는 새로운 방법인 CLAS(Contextual Linear Activation Steering)를 개발했어요.
CLAS는 입력 문맥에 따라 선형 활성화 조향 강도를 동적으로 조절하여 기존 방식보다 일관성 있는 조향 품질을 제공하며, 제한된 데이터 환경에서 ReFT나 LoRA와 유사한 성능을 보여요.
연구 결과, CLAS는 확장 가능하고 해석 가능하며 정확한 언어 모델 전문화 및 조향 방법으로 제시되었어요.