연구진은 비자원 음성 처리에서 어휘 품질 평가의 신뢰성을 재검토했어요. 기존 평가 지표인 정규화 편집 거리는 큰 클러스터 품질에 치우쳐 공정한 평가를 방해한다는 문제점을 지니고 있어요. 클러스터 크기를 고려한 수정 지표와 실제 단어 분포를 평가하는 역지표를 제안하여, 실제 어휘 분포 유사성과 평가 편향에 대한 강건성을 개선했어요.
합성 및 실제 어휘를 활용한 실험 결과, 제안 지표는 기존 지표보다 실제 어휘 분포 유사성을 더 잘 반영하고 편향을 줄이는 데 효과적이었어요. 기존 지표는 큰 클러스터에 편향되어 어휘 품질을 제대로 평가하지 못하는 한계가 있었어요. 연구진은 클러스터 크기를 고려한 수정 지표와 실제 단어 분포를 평가하는 역지표를 제안하여 어휘 평가의 신뢰성을 높였어요.
기존 평가 지표의 한계를 극복하고 실제 어휘 분포를 정확하게 반영하는 평가 지표를 개발하여 비자원 음성 처리 기술 발전에 기여할 수 있을 것으로 보입니다.