연구진이 '나는 믿는다', '아마' 같은 언어적 신호의 신뢰도 교정 프레임워크를 개발했어요. 이 프레임워크는 주관적인 해석 변동성을 고려해 문장의 정확성에 대한 믿음의 분포를 모델링해요.
새로운 평가 지표 '신뢰성 일치도(FD)'를 제시하여 진실 공개 시 청중의 믿음에 주는 놀라움을 정량화하고, 이를 바탕으로 검색 증강 언어적 신뢰도 교정(RALC) 파이프라인을 구축했어요.
RALC는 3개의 QA 벤치마크와 5개의 LLM 패밀리에서 신뢰성과 교정률을 각각 최대 66%와 58% 향상시켜 기존 방식보다 우수한 성능을 보여줬어요.