Pulse · AI 뉴스

LuxEmo: 룩셈부르크어 감정 표현 텍스트 음성 변환 데이터셋

LuxEmo · 2026-07-01

룩셈부르크어와 같이 저자원 언어는 음성 기술 연구에서 소외되는 경우가 많습니다. 연구진은 21시간 분량의 룩셈부르크어 감정 표현 데이터셋 LuxEmo를 공개했습니다. LuxEmo는 RTL 청소년 방송에서 추출했으며, 자동 감지 및 인간 검증을 거쳤습니다.

LuxEmo 데이터셋은 음성 활동 감지, 노이즈 제거, 언어 식별, LuxASR 기반 분할, 자동 감정 예측, 어휘적 단서 등 반자동 큐레이션 워크플로우를 사용합니다. 5가지 감정 표현 TTS 시스템을 벤치마크하여 성능을 평가했습니다.

객관적 지표와 인간 평가를 통해 룩셈부르크어 데이터셋의 활용 가능성을 확인했으며, 저자원 언어 음성 기술 연구에 기여할 것으로 기대됩니다.

##룩셈부르크어##TTS##데이터셋##저자원언어
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기