연구진이 다양한 악센트의 음성 변동성에 취약한 ASR 시스템 성능 개선을 위해 PAREDA(PAper REading DAtaset)를 공개했어요. PAREDA는 호주, 인도 영어, 중국 영어 악센트를 가진 화자들의 NLP 논의 토론 음성 데이터셋이에요.
데이터셋은 논문 요약(monologue)과 질의응답(non-monologue)으로 구성되어 기술 전문 용어와 회화적 특징이 풍부하며, SOTA ASR 모델 평가 결과 zero-shot 환경에서는 성능이 저하되지만, fine-tuning을 통해 WER 감소 효과를 확인했어요.
PAREDA는 기존 데이터셋에서 부족했던 언어적 특징을 포착하여 보다 강력하고 포괄적인 ASR 시스템 구축 및 평가를 위한 귀중한 자료로 활용될 수 있을 거예요.