연구진은 질문에 대한 답변을 여러 번 생성하여 동의 수준을 측정하는 기존 환각 감지 방식의 한계를 지적했어요. 새로운 방법 'phi_first'는 단일 디코딩 과정에서 첫 번째 답변 토큰의 로그 분포를 활용하여 환각 여부를 판단하며, 기존 방식보다 성능이 우수했어요. 연구 결과, 모델의 초기 토큰 분포만으로도 불확실성 정보를 상당 부분 파악할 수 있으며, 'phi_first'를 기본 지표로 활용하는 것을 제안했어요.