연구진은 LLM 에이전트가 권력 불균형 대화에서 인간과 유사한 사회 인지 효과를 보이는지 조사했어요. 다양한 직업군 출신 페르소나를 활용해 다자간 대화를 시뮬레이션하고 언어 조율, 대명사 사용, 설득 성공률, 위험 요청 준수 여부를 측정했어요. 결과적으로 LLM은 권력에 따른 사회 인지 효과를 나타냈지만, 변동성과 차이점도 관찰됐어요.
연구는 시뮬레이션된 상호작용을 통해 LLM의 바람직하고 안전하지 않은 행동 양상을 연결했어요. 페르소나를 통해 권력 불균형을 설정하고 언어 조율, 대명사 사용, 설득 성공률, 위험 요청 준수 여부 등을 분석했어요.
연구 결과는 LLM이 인간의 권력 역학 관계에 따른 언어적, 행동적 패턴을 어느 정도 모방한다는 것을 시사하며, 이는 LLM의 윤리적 사용과 안전성을 고려하는 데 중요한 함의를 갖습니다.