Pulse · AI 뉴스

양방향 미세 조정과 언어 식별을 활용한 저자원 음성 인식 성능 개선 연구

arXiv cs.CL · 2026-06-16

본 연구는 저자원 언어의 자동 음성 인식(ASR)에 양방향 미세 조정이 미치는 영향을 탐구해요. 9개의 다양한 언어 쌍을 대상으로 실험을 진행했으며, 다양한 어족과 문자 체계를 포함했어요. 언어 구분을 위해 훈련 시 입력 텍스트 앞에 언어 식별 토큰을 추가했어요.

언어 식별 정확도가 높을 때 양방향 미세 조정이 효과적이며, 낮은 경우 훈련 및 추론 시 언어 식별 토큰을 포함하면 ASR 성능을 향상시킬 수 있어요. 잘못된 언어 식별은 ASR 성능 저하를 유발하는 것으로 나타났어요.

향후 연구에서는 언어 식별 성능이 낮은 경우에도 ASR 성능을 개선할 수 있는 방법을 모색할 예정이에요.

##음성인식##저자원##양방향미세조정##언어식별
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기