연구진이 딥페이크 음성 탐지 시스템 평가에 사용되는 39개 데이터셋을 분석했어요. 데이터셋의 접근성, 문서화, 인구통계 및 언어 지원, 규모, 원본 음성 소스 등을 조사했죠. 분석 결과, 대부분의 데이터셋이 인구통계 정보가 부족해 공정성 평가가 어렵고, 데이터셋 간 원본 음성 소스가 중복되어 일반화 주장이 과장될 수 있다는 점을 발견했어요.
딥페이크 음성 데이터셋의 언어 및 성별 정보 부족은 공정성 평가를 방해하며, 데이터셋 간 원본 음성 소스 중복은 탐지 시스템의 성능을 과대평가할 수 있어요. 연구 결과는 딥페이크 음성 탐지 기술 개발 시 데이터셋 구성의 중요성을 강조해요.
연구진은 딥페이크 음성 데이터셋의 윤리적·기술적 한계를 지적하며, 향후 데이터셋 구축 시 다양성 확보와 중복 최소화가 필요하다고 제안했어요.