Pulse · AI 뉴스

대규모 언어 모델의 선호도 헤드: 해석 가능한 개인화에 대한 기계적 프레임워크

arXiv cs.CL · 2026-04-24

연구진은 대규모 언어 모델(LLM) 내에서 사용자별 스타일과 주제 선호도를 인코딩하는 '선호도 헤드'의 존재를 가설로 제시했어요.

새로운 프레임워크 'DPS'는 선호도 헤드를 식별하고, 사용자 맞춤형 출력을 생성하는 데 활용하여 개인화의 해석 가능성을 높여요.

DPS는 '선호도 기여도 점수(PCS)'를 통해 각 어텐션 헤드의 인과적 영향을 측정하고, 모델 예측을 비교하여 개인화된 결과를 강화하는 방식을 사용해요.

##LLM##개인화##기계적해석##어텐션##DPS

매일 핵심 AI 소식을 한국어로, 빠르게