Pulse · AI 뉴스

WARDEN: 6시간의 데이터로 원주민 언어 기록 및 번역하는 새로운 모델

WARDEN · 2026-05-14

본 연구는 6시간의 데이터만으로 원주민 언어인 워다만어를 영어로 기록하고 번역하는 WARDEN 모델을 소개합니다.

데이터 부족 문제를 해결하기 위해 WARDEN은 음성 입력을 음성 기록으로 변환하고, 기록을 영어 번역으로 변환하는 별도의 음성 기록 및 번역 모델로 설계되었습니다.

연구진은 음성 기록 모델을 빠르게 조정하기 위해 순다네스 음소를 활용하고, 전문가의 주석을 바탕으로 워다만어-영어 사전 지식을 활용하여 번역 모델의 성능을 향상시켰습니다.

##언어모델##저자원##번역

매일 핵심 AI 소식을 한국어로, 빠르게