본 연구는 저자원 언어의 자동 음성 인식(ASR)에 양방향 미세 조정이 미치는 영향을 탐구해요. 9개의 다양한 언어 쌍을 대상으로 실험을 진행했으며, 다양한 어족과 문자 체계를 포함했어요. 언어 구분을 위해 훈련 시 입력 텍스트 앞에 언어 식별 토큰을 추가했어요.
언어 식별 정확도가 높을 때 양방향 미세 조정이 효과적이며, 낮은 경우 훈련 및 추론 시 언어 식별 토큰을 포함하면 ASR 성능을 향상시킬 수 있어요. 잘못된 언어 식별은 ASR 성능 저하를 유발하는 것으로 나타났어요.
향후 연구에서는 언어 식별 성능이 낮은 경우에도 ASR 성능을 개선할 수 있는 방법을 모색할 예정이에요.