Pulse · AI 뉴스

푸노 께추아어 디지털 보존을 위한 커뮤니티 중심 NLP 자원 구축

연구진 · 2026-05-27

연구진이 푸노 께추아어(qxp)를 위한 최초의 ASR 자원을 구축했어요. 66시간 분량의 음성 데이터(36시간 수동 번역 및 검증)와 ASR 벤치마크, 그리고 오픈 소스 데이터셋과 모델을 공개했어요.

연구진은 커뮤니티 참여 디자인 캠페인을 통해 음성 데이터를 수집하고, Whisper-base, wav2vec2-base, XLS-R-300M 모델을 튜닝했어요. 튜닝된 모델은 오픈 소스로 공개되어 푸노 께추아어 연구에 활용될 수 있어요.

푸노 께추아어는 자원이 부족한 언어인데, 이번 연구를 통해 음성 데이터, 벤치마크, 모델을 공개하며 디지털 보존에 기여하고, 언어 기술 발전을 위한 기반을 마련했어요.

##푸노께추아어##NLP##ASR##언어보존
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기