연구진은 LLM이 생성한 과학 논문에서 허위 인용이 발견될 수 있으며, 이는 학술 기록에 잘못된 정보를 남길 수 있다고 밝혔습니다.
RefChecker라는 자동 검증 파이프라인을 구축하여 ICLR, ICML, NeurIPS, USENIX Security 등 주요 학회의 논문 인용 오류를 분석했습니다.
분석 결과, NeurIPS와 USENIX Security 논문 중 약 20분의 1이 최소 2개의 허위 인용을 포함하고 있으며, ChatGPT 등장 이후 이러한 현상이 증가했습니다.
연구진은 RefChecker를 오픈 소스로 공개하여 출판 전 인용 검증을 통해 학술적 무결성을 확보할 수 있도록 지원합니다.