연구진은 AI 텍스트 탐지를 위해 기존 모델 로그 확률 의존 방식의 한계를 극복하고, 문자 분포 시그니처 기반의 새로운 탐지 신호를 제시했습니다.
MDTA 벤치마크는 4개 모델, 5개 도메인, 3가지 온도 설정, 3가지 적대적 전략을 포함하여 642,274개의 프롬프트 정렬 샘플로 구성되어 HC3 데이터셋을 확장했습니다.
Letter Distribution Score (LD-Score)는 기존 Perplexity 방식과 낮은 상관관계를 보이며, DNA-DetectLLM 등과 결합하여 AUROC 및 F1 점수 향상에 기여합니다.