연구진은 LLM의 위험 결정 과정이 겉보기와 달리 인간의 의사 결정 메커니즘과 일치하지 않을 수 있음을 조사했어요.
상트페테르부르크 게임을 활용해 LLM의 결정 과정을 분석한 결과, 대부분의 모델이 인간과 유사한 위험 회피 성향을 보였지만, 조건부·계산적 합리성을 보이는 경향도 나타났어요.
인간 관점 프롬프트나 instruction tuning은 일부 개선 효과를 보였지만, 근본적인 메커니즘 정렬 문제는 해결되지 않았으며, 결과 유사성만으로는 LLM의 의사 결정 신뢰도를 판단하기 어렵다는 점을 시사해요.