연구진이 임상 환경의 음성 기록에서 다국어 표기 변동성을 고려한 ASR 평가 벤치마크 'MultiClin'을 발표했어요. 기존 방식은 음성 기록의 다양한 표기를 오류로 간주하는 한계가 있었어요. 실험 결과, 다국어 변동성을 고려한 평가가 ASR 품질을 더 정확하게 반영하는 것으로 나타났어요.
MultiClin 연구에서 훈련 시 표기법 일관성이 중요하며, 불균형한 표기 매핑은 모델 수렴을 방해하는 것으로 확인됐어요. 표기법을 통일하는 것이 ASR 성능 향상에 효과적이었어요.
연구팀은 MultiClin 데이터셋과 코드를 GitHub에서 공개하여 연구의 재현성과 발전을 도울 예정이에요.