연구진은 희소 자동 인코더(SAE)를 활용하여 LLM 내부의 감정 인식 메커니즘을 분석했어요. 분석 결과, 감정 관련 특징은 LLM의 마지막 단계에서만 나타나며, 공통 특징과 감정별 특징으로 구성돼 있어요. 새로운 원인적 특징 조작 방법을 통해 LLM의 감정 인식 성능을 향상시키고, 언어 모델링 능력은 유지했어요.