최근 LLM의 OOD(Out-of-Distribution) 탐지 방법들이 효과적인 것처럼 보이지만, 입력 길이( |r| >= 0.61)에 의해 구조적으로 혼동되며 길이 맞춤 평가 시 무작위 수준으로 떨어지는 것으로 나타났습니다.
본 연구에서는 텍스트의 내용을 파악하는 임베딩과 입력 처리 과정을 포착하는 처리 경로라는 2가지 경로 프레임워크를 제안하여 길이 혼동을 해소하고 진정한 OOD 신호를 식별하고자 했습니다.
어휘 투명도 스펙트럼에 따라 각 경로의 효력이 달라지며, 어휘적으로 구별되는 OOD에서는 임베딩 방법이, 어휘를 공유하는 잠재적 의도 입력에서는 처리 특징이 우수한 것으로 나타났습니다.