연구진은 대규모 언어 모델(LLM) 내에서 사용자별 스타일과 주제 선호도를 인코딩하는 '선호도 헤드'의 존재를 가설로 제시했어요. 새로운 프레임워크 'DPS'는 선호도 헤드를 식별하고, 사용자 맞춤형 출력을 생성하는 데 활용하여 개인화의 해석 가능성을 높여요. DPS는 '선호도 기여도 점수(PCS)'를 통해 각 어텐션 헤드의 인과적 영향을 측정하고, 모델 예측을 비교하여 개인화된 결과를 강화하는 방식을 사용해요.