연구진은 LLM이 이전 대화 기록의 극성에 따라 판단이 편향될 수 있는 '누적 메시지 효과(AMEL)'를 확인했어요.
75,898건의 API 호출 결과, 모델들은 대화의 주류 극성에 맞춰 판단이 바뀌는 경향을 보였으며, 불확실성이 높은 항목에서 편향이 더 두드러졌어요.
부정적인 대화 기록이 긍정적인 기록보다 1.62배 더 큰 편향을 유발했으며, 새로운 컨텍스트를 사용하거나 대화 기록을 균형 있게 조정하는 방식으로 해결 가능해요.
토큰 확률 분포 변화, 부정성 비대칭, 위치의 중요성 등 AMEL의 작동 메커니즘에 대한 추가적인 연구 결과도 함께 발표됐어요.