본 연구는 6시간의 데이터만으로 원주민 언어인 워다만어를 영어로 기록하고 번역하는 WARDEN 모델을 소개합니다.
데이터 부족 문제를 해결하기 위해 WARDEN은 음성 입력을 음성 기록으로 변환하고, 기록을 영어 번역으로 변환하는 별도의 음성 기록 및 번역 모델로 설계되었습니다.
연구진은 음성 기록 모델을 빠르게 조정하기 위해 순다네스 음소를 활용하고, 전문가의 주석을 바탕으로 워다만어-영어 사전 지식을 활용하여 번역 모델의 성능을 향상시켰습니다.