최신 연구에 따르면, 선별된 작은 데이터셋으로 미세 조정하여 언어 모델의 특정 행동 가치에 대한 행동을 개선할 수 있어요. 기존 방식보다 적은 데이터로도 효과적인 개선이 가능하다는 점이 특징이에요. 연구 결과는 언어 모델의 행동 제어에 대한 새로운 가능성을 제시합니다.