대규모 언어 모델(LLM)의 환각 현상을 탐지하는 데 불확실성 추정이 유망한 방법으로 떠올랐어요. SIVR은 레이어별, 토큰별 특징을 활용하여 내부 표현의 분산 정도를 통해 불확실성이 나타난다는 기본적인 가정을 채택하여 모델과 작업에 구애받지 않도록 설계되었어요. 실험 결과 SIVR은 강력한 기준 모델들을 능가하는 성능을 보였으며, 일반화 능력이 뛰어나고 대규모 학습 데이터에 의존하지 않아 실용적인 배포 가능성을 보여주었어요.