본 연구는 텍스트 기반 방식의 한계를 극복하기 위해 음성 기반 특징을 활용하여 중국 방언 간 언어 구별 성능을 탐구했어요. CNN 기반 언어 구별 모델에서 음성 기반 MFCC 특징의 적합성을 분석하고, HMM-DNN 기반 종단간 음성 인식 모델을 설계했어요. 주의 집중(attention) 메커니즘을 통해 방언별 차별적인 단어를 추출하고, CNN을 통해 단어 임베딩과 MFCC 기반 특징을 결합했어요.
두 개의 중국 방언 벤치마크 데이터셋 평가 결과, 제안하는 음성 기반 접근 방식이 기존 방식보다 미세한 방언 차별화에 효과적이었어요. 기존 방식 대비 성능 향상을 확인했으며, 음성 기반 특징의 유용성을 입증했어요. 본 연구는 언어 구별 연구에 음성 기반 접근 방식의 가능성을 제시합니다.