연구 결과, LLM은 답변 정확도보다 자신감이 높고, 특히 사용자 답변보다 자신감을 더 크게 드러내는 '소유 편향' 현상이 나타납니다. 이러한 현상은 instruction tuning과 chat template의 복합적인 문제로, 모델이 자신의 답변에 최대 26% 더 높은 확신을 부여합니다. 연구진은 모델 답변을 사용자 입력으로 재구성하는 간단한 방법을 통해 과신 문제를 완화하고, 모델의 교정률을 26%까지 향상시켰습니다.