연구진은 토큰 수준 환각 감지기를 분류기로 평가하고, 스트리밍 모니터는 환각 발생과 경고 사이의 시간으로 판단합니다. RAGTruth 데이터셋을 기반으로 한 마르코프 모델 분석 결과, 오경보율 0.01에서 환각 감지 지연은 약 1.3 토큰으로 나타났습니다. 학습된 CUSUM 방식은 기존 방식보다 11~13 토큰 내에 환각을 감지하며, 정보율 최적성 이론에 따르면 잠재력의 1/4.5만 활용하는 한계가 있습니다.