NeurIPS 2026 포지션 페이퍼 심사 과정에서 AI 텍스트 감지기 Pangram을 활용해 desk rejection을 결정했는데, 이 과정에서 오탐 가능성이 있다는 논란이 일고 있어요.
AI 텍스트 감지기 점수가 높으면 저자의 AI 사용 고백과 일치하지 않는다고 판단하고 desk rejection을 내리는데, 이는 감지기 결과에 의존적인 판단 오류를 야기할 수 있어요.
Pangram의 오탐률을 검증하기 위해 NeurIPS 포지션 페이퍼 트랙 의장들의 논문을 분석한 결과, 24%에서 69%까지 AI 점수가 나왔는데, 이는 AI로 작성된 논문이라고 단정하기 어렵다고 지적했어요.