본 연구는 장문 텍스트 생성 시 LLM의 불확실성 정량화 문제를 해결하기 위해 Interrogative Uncertainty Quantification (IUQ)라는 새로운 프레임워크를 제안합니다.
IUQ는 샘플 간 일관성과 샘플 내 충실성을 활용하여 장문 LLM 출력의 불확실성을 측정하며, 질문-응답 방식을 통해 신뢰성 있는 주장의 불확실성 지표를 제공합니다.
다양한 모델과 크기에서 실험한 결과, IUQ는 기존 방식보다 뛰어난 성능을 보였으며, 관련 코드는 GitHub에서 확인할 수 있습니다.